LMArena最新排名:文心大模型5.0 Preview文本能力位居国内第一
北京青年报客户端 2025-12-23 11:32

12月23日,LMArena 大模型竞技场发布最新排名,文心新模型 ERNIE-5.0-Preview-1203 以 1451 分登上 LMArena 文本榜,排名中国第一。在创意写作、高难度指令等方面表现突出,超过Claude-Opus-4-1、GPT-5.2、GPT-5.1、和Qwen3-Max-Preview等多款国内外主流模型。



在创意写作及复杂任务场景中,ERNIE-5.0-Preview-1203 能够准确理解用户需求,生成结构清晰、逻辑一致的文本内容。据知情人士透露,文心大模型5.0正式版将于1月上线。

公开资料显示,文心大模型于2019年首次对外发布,文心大模型5.0是百度今年11月发布的原生全模态大模型。该模型参数量达2.4万亿,采用原生全模态统一建模技术,具备全模态理解与生成能力,支持文本、图像、音频、视频等多种信息的输入与输出。

此前,文心大模型 5.0 Preview 在 LMArena 文本榜中位居全球并列第二、中国第一,超过GPT-5-High等多款国内外主流模型;同时,在 LMArena 视觉理解榜中位居国内第一,整体表现与 Claude-Sonnet-4、GPT-5-High 相当。

相关阅读
AICC 2025召开 百度CTO王海峰解读大模型技术与产业应用
北京青年报客户端 2025-09-26
国内首个!文心X1 Turbo获信通院“4+级”最高评级
北京青年报客户端 2025-05-20
提前免费!百度发布文心大模型4.5及X1
北京青年报客户端 2025-03-16
AI大模型 从重投入转向重产出
上海证券报 2025-01-08
比GPT-3.5 Turbo便宜超60% OpenAI推出小模型卷性价比
每日经济新闻 2024-07-22
蚂蚁百灵大模型最新进展:已具备原生多模态能力
北京青年报客户端 2024-07-05
炸锅!斯坦福AI团队,被曝抄袭中国大模型!各方最新回应
证券时报 2024-06-04
大模型的“中场战事”:价格战燃起 谁得益、谁受伤?
第一财经 2024-05-23
最新评论