继大模型后,“具身智能”成为今年科技界的新热点,被认为是新一波人工智能(AI)浪潮中的重点方向。众多初创公司涌现、融资屡创新高、技术不断突破……人形机器人作为该领域最具代表性的实体,正在大模型催化下加速产业化落地。
如果将大模型视为“有趣的灵魂”,“具身智能”赋能的人形机器人则有了“好看的皮囊”,已在多个领域成为人类的有力助手。作为连接虚拟空间和现实空间的桥梁,“具身智能”是指将AI融入机器人等物理实体,赋予它们像人一样感知、学习和与环境动态交互的能力。
“具身智能”一词本身具有浓厚的技术哲学色彩。1945年,法国哲学家莫里斯·梅洛-蓬蒂提出“具身性”概念,认为人类需通过身体与周围环境进行互动和感知,进而理解世界。1950年,被称为“AI之父”的英国计算机科学家图灵在论文《计算机器与智能》中首次提出“具身智能”这一概念。
事实上,智能化水平相对较低的工业机器人(机械臂)早已在制造业广泛应用。但传统工业机器人是“固定程序+机械臂”的组合,而“具身智能”赋能的机器人则是“多模态感知+大脑决策”的迭代。
未来机器人将呈现多姿多彩的形态:双足、四足、轮式,机械狗、智能无人机甚至机械小蜜蜂,但人形机器人对人类社会适配性最佳,将成为最能够帮助人类的机器人。
人形机器人可解决生产线“最后一公里”的问题。很多个性化、定制化的产品无法靠流水线统一组装,这就需要具有泛化能力的人形机器人来“帮忙”,把批量生产的零部件按客户的定制需求组装成产品。在家庭服务、公共服务等更复杂多变的场景中,人形机器人也更具优势,可适应不同的环境和需求完成多种任务。
人形机器人研发始于对人类的学习与模仿,其研发难点也可以比照人类的大脑、小脑和本体来理解。“大脑”主要是机器人负责自主学习、规划和决策的中枢;“小脑”负责运动控制,包括从行走到跑跳,以及从简单抓取到复杂的手部动作等;而“本体”部分则包括躯干四肢结构和灵巧手设计。目前这三大领域都有较多技术难点有待突破。
大模型的出现让机器人“大脑”显著“进化”,大大提升了机器人的通用性和泛化性,有望降低人形机器人开发成本,加速其走入千家万户。现在业界主要使用预训练大模型对机器人进行预训练,让其具备更强学习能力;大模型可将特定任务的学习迁移到机器人任务上,提高其适应能力;另外还可利用大模型的多模态处理能力,结合视觉、听觉、触觉等各种输入,提升机器人对复杂场景的理解。
环顾全球,人形机器人已进入产业化落地初期阶段,在工业制造、商用服务和家庭陪伴领域开始“试水”。无论是技术突破、落地进展还是融资规模,人形机器人研发竞赛基本以中美为主导。
大模型研发能力、感知技术的领先使美国企业在机器人决策系统和复杂任务处理方面具有更强竞争力。而中国的优势更多体现在工业机器人领域,特别是在制造业中的应用较为成熟。在人形机器人技术专利方面,中国也已走在前列。
如何在真实世界场景中采集大量数据,并将数据统筹流通和供给人形机器人行业是关键。真实世界的数据一般都靠各家机器人公司自己采集。北京人形机器人创新中心有限公司正计划打造一个开源数据集供学界和业界使用。未来,高质量的共享数据集将大大助力行业发展。
文/新华社记者 彭茜 张漫子
图源/视觉中国
编辑/姬源