半两财经|北京人形WoW世界模型让机器人又多一项新技能
北京青年报客户端 2025-10-17 19:50

10月17日,北京青年报记者从北京人形机器人创新中心获悉,该中心开源了全新的世界模型架构,提出了一个让机器人真正“看见、理解并行动于世界”的具身世界模型——WoW(World-Omniscient World Model),帮助具身智能机器人快速学习掌握各项技能,助力行业打造“最好用”的机器人。这也是继Deepseek在大语言模型开源促进行业发展后,又一个打破边界进行开源的大模型。

北京人形机器人创新中心“具身天工Ultra”获得全球首个人形机器人半程马拉松冠军,并且采用”全自主“方式在首届世界人形机器人运动会,获得100米短跑项目的冠军,成为人形机器人史上首个百米“飞人”,充分展示其“最能跑”的领先技术实力;基于”慧思开物“平台下的”具身大小脑协同,北京人形仅凭天轶2.0一款机器人,在首届世界人形机器人运动会一举斩获一金三银一铜的优异成绩,表现出卓越的泛化能力——面对毫米级物料插装、复杂路径搬运、行李识别与运送等任务,均能在无人干预下高效完成,能够在多个垂直场景中同时达到顶尖水平,且在效率上不输专用机器人,同样也证明了其“最好用”。

本次WoW具身世界模型的开源,使得全球研究者不仅能够复现论文结果,更能够在WoW的基础上进行深入研究和应用开发,大大降低了世界模型研究的入门门槛,加速具身智能机器人走入生活方方面面。

据介绍,这不仅仅是一次视觉模型的升级,更是一个融合了视觉、动作、物理感知与推理的统一世界生成框架。它让AI不再只是“看视频”或“生成图像”,而是能通过交互学习世界的物理规律,并在真实环境中自主操作。如果说GPT系列让机器“读懂语言”,Sora系列是在“看世界”,那么 WoW 就是让机器人“理解物理世界”,并且给到算法触摸世界的双手。创新的技术架构、完全开源的策略、完整的工具支持,使得WoW有望成为世界模型领域的“Deepseek"。

WoW具身世界模型能够根据环境状态与历史帧,预测未来场景、推演物理演化、还原动态因果链。WoW 不是在记忆训练场景,而是在学习“物理规律的抽象本质”,具备跨机器人形态泛化、任务泛化、场景泛化全方位能力,这类“视觉+物理”的泛化能力,是通向具身智能的关键指标。

它可以让世界模型“自己教自己”。WoW 具身世界模型在语言引导下生成物理上合理的未来,通过“生成预测—批评—修正”的迭代循环机制,将“想象”与“推理”统一为具身智能的基本组成部分,正类似于人类智能“想象-验证-修正-再想象”的核心特征,让模型越看越准,越生成越真实。

WoW具身世界模型还能实现视频生成和机器人动作闭环,意味着AI不再停留在“想象中”,而能真正“动手”去验证自己的理解,标志着真正实现从生成到执行的跨越。

文/北京青年报记者 宋霞
编辑/ 张丽

相关阅读
上海发布人形机器人数据集标准,人形机器人有了统一数据语言
澎湃新闻 2025-09-24
人形机器人马拉松冠军从“最能跑”向“最好用”进化|机器人发展看北京
北京青年报客户端 2025-08-10
2025具身智能机器人十大发展趋势发布
央视新闻 2025-08-08
不破不立的教育之路:陈向东和高途的第11年
北京青年报客户端 2025-06-23
人形机器人落地应用难在哪?数据、硬件、算法均待提升
澎湃新闻 2025-06-02
人形机器人会跳舞和空翻还不够?通用具身智能仿真平台“格物”发布
澎湃新闻 2025-03-21
2025年会是人形机器人量产元年吗?
澎湃新闻 2025-02-02
巨头扎堆入局 人形机器人量产渐行渐近
证券时报 2025-01-22
最新评论