8月10日,2025世界机器人大会主论坛上,中国工程院院士倪光南作《“AI+空间计算”让机器看懂世界》的报告时表示,当前人工智能引领科技范式变革的时代,在国家实施“人工智能+”行动的大形势下,机器人发展到AI+机器人,将更好地发挥新质生产力的作用。
为了达到这个要求,关键在于提升机器人智能水平,脑-眼-行动协同的系统将提高机器人智能水平,真正让机器人能够看见世界、理解世界、行动于世界。
“AI+空间计算”重构三维物理世界
大语言模型不是世界的全部,生成式AI不能完全辐射物理世界。倪光南认为,空间计算对于物理世界来讲,人们对于物理世界的重构和生成,生成的大语言模型目前来讲引领着科技的发展,但是大语言模型和生成式AI均不能完全辐射复杂的物理世界,“AI+空间计算”融合正以一种全新的方式重构三维物理世界,搭建了大模型通向物理世界的桥梁,促进了物理世界和数字世界的融合。
空间计算在其中起着重要的作用。倪光南在演讲时说,“我们认为“AI+空间计算”是当前落实“人工智能+”行动的一项关键核心技术。”视觉是智能的起点。为处理信息,从眼睛开始,大脑构成了对于世界的信息都要参与处理。人们要认识世界、理解世界需要用到大量的视频信息,视觉也是物理世界控制感知的基础,是大脑和物理世界作用的桥梁。机器人用“AI+空间计算”进行的理解和建模的过程。
在机器人的脑和眼的方面投入不够
可以预测机器人产业是未来产业、新兴产业。机器人的智能一般来说可以分为三大部分:脑、眼和行动系统。这三部分组在一起变成具身智能系统,能够全面体现机器人智慧发挥它的作用。目前看,在机器人的脑和眼的方面投入不够,相对来说是一个短板,需要特别予以加强,更好地体现机器人的效能。
倪光南说:“类比智能汽车分为L1-L5不同等级,机器人有一些组织进行相似的分类。现阶段的机器人大体上是L1-L3水平,我们希望通过‘眼睛’和‘脑’的发展,把机器人整体的智能水平发展到L4以上,这样机器人才真正体现出它的能力,更好地特别是我们强调的移动、自主、高精度。能够真正发挥机器人在提升生产效率方面起的作用。”
开源的AGIROS支撑“机器人的行动”
对于机器人行动系统来说,机器人手、脚、轮子等发生交互,需要有一个操作系统。通过开源开放、协同创新为智能机器人发展打下坚实的基础。中国科学院软件所支持的开源的AGIROS,凝聚机器人产学研用各方面的资源,全面推进智能机器人领域的发展。作为标准的开源机器人操作系统,支撑“机器人的行动”。AGIROS社区已有大批的单位以及开发者加入。
倪光南说:“我们的目标要构建AI+机器人的生态系统,历史上大的领域出现了一些大的系统,比如说PC时代有Wintel;移动手机时代有AA;我们做的RV+OSS这都是人类智能体世界。进入到机器人的世界,人工智能体的世界,未来想提供AI+RV的芯片以及形成脑-眼-行动这样一个完整智能系统的生态。形成人工智能及芯片生态的潮流。”
文/北京青年报记者 蔺丽爽
摄影/北京青年报记者 崔峻
编辑/周超