让机器人解锁“托马斯全旋”,北京科学家发布首个通用运动控制框架
北京青年报客户端 2026-03-05 19:56

北京青年报记者3月5日了解到,近日,北京通用人工智能研究院联合宇树科技等机构发布OmniXtreme框架,成功让机器人学会执行包括后空翻托马斯全旋、武术踢击在内的数十种高动态“极限运动”,并在宇树机器人上实现了真实世界的高成功率部署。该框架是首个可以执行各种极限动作的通用策略,为人形机器人学习复杂运动方式带来明显提效,解决了动作保真度与可扩展性兼顾的难题。

长期以来,让机器人像人类一样灵活运动,是机器人学领域的核心追求。然而,让机器人模仿单个高难度动作如一个后空翻,已能做到非常精准,但一旦试图让机器人学会几十个风格迥异、动态复杂的动作,其学习效果就会大打折扣——控制器变得保守、平庸,在最具挑战性的动作上频频失败。

OmniXtreme框架的实现过程首先是预训练一个基于流的生成控制策略,然后针对复杂物理动力学进行“驱动感知残差强化学习”的后训练。其中,后训练这一步对于成功实现真实世界的迁移至关重要。在人形机器人的运动控制领域,研究人员长期面临一个被称为“泛化壁垒”的困境。当动作库的规模和多样性增加时,传统的统一强化学习策略往往会遭遇性能崩溃,这在高动态动作的物理部署中尤为明显。这种崩溃源于两个相互叠加的瓶颈:仿真环境中的学习瓶颈(多动作优化的梯度干扰)以及物理执行瓶颈(真实世界复杂的驱动约束)。

为了从根本上解决这一问题,研究团队提出了OmniXtreme框架。该框架将动作技能的学习与物理驱动的微调进行了巧妙的解耦,分为“基于流的可扩展预训练”与“驱动感知的残差后训练”两个核心阶段。

为了验证系统是否打破了泛化壁垒,团队设计了渐进式的压力测试。他们将训练动作集从10个逐步扩展到20个,最终扩展到50个,并使用固定的前10个动作进行统一评估。实验结果揭示了显著的差异。随着动作多样性的增加,传统从头训练的强化学习基线模型出现了严重的性能衰退,其成功率从100%暴跌至83.3%,最终滑落至73.9%。相比之下,OmniXtreme展现出了惊人的韧性,在50个动作的庞大训练集下,其对核心动作的跟踪成功率依然坚挺在93.3%。这彻底推翻了高保真度必定随着多样性增加而崩溃的固有认知。

北京通用人工智能研究院供图

文/北京青年报记者 雷嘉
编辑/汪浩舟

相关阅读
具身天工3.0进化,解锁托马斯回旋新技能|北京经济新航标
北京青年报客户端 2026-02-14
“巧手机器人”实现33种抓握动作,还能双面抓握、自主爬行
科技日报 2026-01-21
北京高中生首次与机器人同台“辩论”
北京青年报客户端 2025-12-14
全球首个“力位混合控制算法”提出
央视新闻 2025-10-20
半两财经|北京人形WoW世界模型让机器人又多一项新技能
北京青年报客户端 2025-10-17
在上海,机器人正加速“进化”
人民日报海外版 2025-05-19
机器人足球赛、机器人救援赛……2000余名爱好者齐聚雁栖湖比拼“机器人”
北京青年报客户端 2025-05-02
最新!智元机器人出手 挖来前谷歌90后具身智能大佬!
证券时报网 2025-04-06
最新评论