美团发布万亿参数大模型,全程由国产算力训练
北京青年报客户端
2026-06-30 15:51
6月30日,美团正式发布新一代基础大模型LongCat-2.0。该模型依靠国产算力完成训练、推理全流程,总参数规模1.6万亿。
美团无人机,受访者供图
据悉,LongCat-2.0采用MoE架构,总参数规模过万亿,每个Token激活参数约480亿,原生支持1M超长上下文,可一次处理百万字级输入。模型深度适配Claude Code、OpenClaw、Hermes等主流Harness,在Coding任务上有较强的表现。
据介绍,LongCat-2.0全程在国产算力上完成训练,峰值规模超过5万张国产算力卡,是迄今为止国产算力上完成的最大训练任务。
据悉,2023年起,美团就与国产算力厂商共同推进“模芯协同”研发,从早期的小规模验证到超大规模稳定训练,逐步攻克了万卡级容错恢复、NPU确定性计算、算力利用率提升等核心难题,验证了大规模国产训练的可行性。
据悉,由于算力优化、技术突破等综合因素,LongCat-2.0的训练、推理成本消耗,低于全球其他万亿参数级别的大模型。
对此,LongCat官方宣布,将于近期在多平台同步开源Infra框架、推理引擎、模型参数等核心技术,以回馈全球开发者社区。
文/北京青年报记者 温婧
编辑/周超
相关阅读
IP赋能+文化深耕,52TOYS点亮中国玩具出海新图景|关注中小微
北京青年报客户端 2026-06-09
扣子3.0版本上线,支持本地与云端Agent协同工作|新品速递
北京青年报客户端 2026-06-02
诺亦腾机器人发布三大核心数据集, 预期年产能45万小时
北京青年报客户端 2026-06-02
“十四五”时期直接融资超6万亿元!北京资本市场高质量发展呈现七大亮点|北京经济新航标
北京青年报客户端 2026-05-18
机构:00后银发族“双引擎”驱动,今年五一自驾游人均时长增长11%
北京青年报客户端 2026-05-06
花卉景观布置已完成,东城区以缤纷花卉扮靓假日
北京青年报客户端 2026-04-30
话题|国产车这样赢了雅马哈杜卡迪,张雪赛道加冕,中国制造破局
北京青年报客户端 2026-03-31
爱奇艺纳逗・AIGC 创投大会招募,以 AI 赋能影视创作挖掘新势力
北京青年报客户端 2026-03-17
最新评论
