本届广州车展前,理想汽车刚刚在10月收获了创立以来的最高单月销量:51443辆。然而,销量越是坚挺,理想汽车就越希望摆脱消费者对其“冰箱彩电大沙发”的单一印象。在本次车展上,理想汽车举办了多场技术沙龙,着力宣传AI人工智能技术如何赋能智能驾驶和智能助手两大功能,希望理想汽车打造更立体的品牌形象,创造更丰富的产品卖点。
被称为“理想同学”的理想汽车AI智能助手不仅是一个简单的智能助手,它代表着理想汽车对于人工智能载体的深刻理解和未来愿景。依据技术发展水平和应用场景,理想汽车为其规划了三阶段发展路线:增强能力,成为助手,成为家人。
在最初的增强能力阶段,理想同学通过高清视觉和灵敏听觉,清晰感知周围环境,并迅速响应用户需求。随后,成为助手阶段,理想同学通过深入理解自然语义,帮助用户解决生活和用车中的问题,调用各种工具,成为用户日常生活中的得力助手。最终,在成为家人阶段,理想同学将具备人的理解、规划和执行能力,从情感上与用户建立深厚的联系,成为家庭中的一员。
按照理想汽车的设定,当前的“理想同学”已经进化到第二阶段——成为助手。
据介绍,借助双麦阵列麦克风和声纹跟踪技术,“理想同学”实现了全舱自由对话,照顾到每一位家庭成员的需求。“理想同学”接入了上百个车辆信号,除提供联动空调、导航等基本语音控制功能之外,还拥有丰富的内部知识和外部检索能力,能够查询车辆状态、故障诊断,并解答用车难题,基于上述信息,它还能为用户提供出行建议和娱乐信息。
值得一提的是,“理想同学”同样围绕理想汽车服务家庭用户的核心产品定位,着力发挥AI对用户家庭的服务场景。例如,“理想同学”提供了小主人模式和儿童应用,包括成语接龙、百科知识等,以及声纹识别和图文并茂的交互方式,让孩子们的学习更加有趣。
“理想同学”能有此出色表现,离不开理想汽车全自研的多模态认知大模型Mind GPT的支持。理想汽车的工程师介绍说,Mind GPT通过全栈式自研,实现了从基座模型到顶层大模型应用的快速反应和准确知识。
在感知层面,Q-MoE连接器将语音、视觉多模态信号连接到Mind GPT语言大模型上,使其感知更加灵敏,还创新性地把外部知识图谱信息接入到大模型,极大地增加了知识准确性;在决策层面,模型结构从稠密模型演变成了稀疏模型,在线推理速度比以前更快;在执行层面,“理想同学”能够像人一样拆解并调用合适工具,自主完成任务。如果没有合适的工具,它还能自主创造工具,执行后反思任务是否执行正确,并进行调整。
据统计,“理想同学”演进至今,累计唤醒次数已达23.8亿次、任务完成率高达96%;Mind GPT对话次数增长4倍、用户满意度96.2%。
除了智能助手的进化,AI大模型同样为理想汽车的高阶智能驾驶辅助功能赋能。
理想汽车目前已经推送了端到端+VLM双系统智驾方案。其中,One-Model结构端到端模型具有更高效的信息传递、更高效的推理计算和更高效模型迭代。VLM视觉语言大模型则首次将大模型部署到车端量产芯片,在物理世界中理解复杂的交通环境和语义。
理想汽车方面表示,目前已经全量推送的智驾系统支持车位到车位的全场景智能驾驶体验,能够提供类似人类司机的驾驶水平,覆盖跨层地库、园区闸机、交通博弈等复杂场景。
与此同时,理想汽车的AI模型能力迭代也会维持高速水准。自端到端+VLM双系统方案发布以来,两个月内共迭代25版模型,平均2-3天一个模型。接管频次由首个版本的10公里/次,进化到接近30公里/次,MPI平均接管里程提升3.5倍,堪称“越用越好用”。
如果说“冰箱彩电沙发”主打的舒适体验是理想汽车的立身之本,那么AI赋能的智能化体验就代表着理想汽车的发展方向。在理想汽车的设想中,由“硅基司机”开车、有“硅基家人”陪伴,并且享受着冰箱彩电沙发的未来出行场景,正离人们越来越近。
文/杨铮
编辑/杨铮