Meta官宣深入AI大战 推出先进大型语言模型 欲背刺ChatGPT
财联社 2023-02-25 12:06

当地时间周五,脸书母公司Meta首席执行官扎克伯格最新推出了“Meta人工智能大型语言模型”(Large Language Model Meta AI),简称“LLaMA”。

扎克伯格在社交媒体上称,Facebook AI Research研发的LLaMA是“目前水平最高的”大型语言模型,目标是帮助研究人员推进他们在人工智能(AI)领域的工作。

“大型语言模型”(LLM)可以消化大量的文本数据,并推断文本的单词之间的关系。随着计算能力的进步,以及输入数据集与参数空间的不断扩大,LLM的能力也相应提高。

目前,LLM已经被证明能高效地执行多种任务,包括文本生成、问题回答、书面材料总结等。扎克伯格称,LLM在自动证明数学定理、预测蛋白质结构等更复杂的方面也有很大的发展前景。

值得一提的是,近期大火的ChatGPT就是采用LLM构建的聊天机器人。ChatGPT由GPT3.5提供支持,而GPT3.5是一款基于OpenAI 175B参数基础模型训练的LLM,175B是它从训练数据中所学习、沉淀下来的内容。

Meta在官网介绍中称,LLaMA有7B、13B、33B和65B四个基础模型,在大多数基准测试中都优于GPT3.5的前身GPT3-175B,而LLaMA-65B可与业内最佳的Chinchilla-70B和PaLM-540B竞争。

Meta还宣布,将针对学术研究者共享其模型,正在接受研究人员的申请。与之截然不同的是,谷歌旗下的DeepMind和OpenAI并不公开训练代码。

根据2021年媒体的一份调查显示,AI专家们通常将DeepMind、OpenAI和FAIR(Facebook AI Research)视为该领域的“前三甲”。

去年年底,Meta发布了另一款名为Galactica的模型,但因经常分享偏见和不准确的信息而遭到下架。

编辑/范辉

相关阅读
革命性o1模型问世 OpenAI警示:生物武器风险也有所上升
财联社 2024-09-18
OpenAI“草莓项目”最快今年秋季发布 为何AI圈子紧盯这件事?
财联社 2024-08-30
药食同源理念创新实践:国药大健康携手官栈共创中式滋补新品
北京青年报客户端 2024-08-26
价格战凶猛 AI小模型狂飙
21世纪经济报道 2024-07-30
Meta发布Llama 3.1开源大模型系列 扎克伯格:开源人工智能是前进之路
澎湃新闻 2024-07-25
扎克伯格:开源是AI未来的方向,美国要领先中国AI数年的目标不现实
澎湃新闻 2024-07-25
OpenAI宣布已启动下一代前沿模型训练 AGI愿景变得更加务实
财联社 2024-05-29
有望打败闭源模型?阿里、百度、腾讯云厂商抢食开源Llama 3算力
第一财经 2024-04-23
最新评论