去年9月毫末智行(以下简称“毫末”)在业内首次提出自动驾驶3.0时代理念。在毫末看来,近十年自动驾驶技术发展可分成三个阶段:最早硬件驱动的1.0时代、近几年软件驱动方式的2.0时代以及数据驱动方式的自动驾驶3.0时代。
为了冲刺自动驾驶3.0时代的感知、认知、模式建设,毫末自今年4月正式发布自动驾驶生成式大模型DriveGPT后,时隔半年,再次宣告自己的最新成果。10月11日,毫末发布三款“极致性价比”千元级无图NOH,以满足高中低价位智驾车型量产需求,并展示了行业首个自动驾驶生成式大模型DriveGPT雪湖·海若公布最新成果。
千元市场:智驾也拼性价比
张凯介绍,目前乘用车销量和智能化指数在稳步提升,智能驾驶渗透率与价格却呈反向增长,乘用车市场L2及以上智能驾驶渗透率达42.4%,2025年将达70%,并普及到10-20万的主销车型上;城市NOA迎来量产上车潮,目前占L2及以上辅助驾驶份额的17%,2025年将达70%。
智驾快速普及上车的同时,毫末重磅发布了HP170、HP370、HP570三款“极致性价比”智能辅助驾驶产品,预计将在今年和明年先后上车。张凯表示:“毫末全新发布的第二代HPilot乘用车辅助驾驶三款产品,价格打下来的同时性能都打了上去,让中阶智驾便宜更好用,让高阶智驾好用更便宜。”
成立近4年,毫末希望帮友商“花小钱办大事”。从3000到8000,下沉至千元市场,毫末追求的是极致性价比。
毫末HP170是3000元级的高速无图NOH,可实现高速、城市快速路上的无图NOH,短距离记忆泊车等功能。算力5TOPS,传感器方案标配1个前视相机、4个鱼眼相机、2个后角雷达、12个超声波雷达,灵活选装1个前视雷达和2个前角雷达。
5000元级的毫末HP370可实现高速、城快,以及城市内的记忆行车,免教学记忆泊车、智能绕障等功能,行泊一体智驾。算力32TOPS,传感器方案标配2个前视相机、2个侧视相机、1个后视相机、4个鱼眼相机、1个前雷达、2个后角雷达、12个超声波雷达,灵活选装2个前角雷达,可以看作是毫末城市NOH的最小集。
除此之外,毫末HP570是8000元级的城市全场景无图NOH产品,可实现城市无图NOH、全场景辅助泊车、全场景智能绕障、跨层免教学记忆泊车等功能。算力可选72TOPS和100TOPS两款芯片,传感器方案标配2个前视相机、4个侧视相机、1个后视相机、4个鱼眼相机、1个前雷达、12个超声波雷达,还支持选配1颗激光雷达,未来将在100+城落地。
一边智驾快速上车,一边全面落地智驾城市化应用,毫末“城市NOH百城大战”一触即发。
据张凯介绍,在中国的自动驾驶公司中,毫末稳居中国量产自动驾驶第一名,辅助驾驶产品HPilot整体已搭载在超20款车型上,用户辅助驾驶行驶里程突破8700万公里。最新搭载毫末HPilot的车型为山海炮HEV版、新摩卡Hi-4S等。此外,具备城市NOH导航辅助驾驶功能的毫末HP550(原HPilot3.0),将搭载在魏牌蓝山上,预计明年第一季度正式量产上市。
造车、用车的智能化是未来用户的出行刚需。但在未来的城市道路上,或许不止有“智驾的车”,在未来,终端物流配送的智能化同样十分重要。
据毫末智行介绍,全球首款9万元内(售价89999元)的中型末端物流自动配送车小魔驼3.0,可满足物流、商超、零售等9大场景的需求。目前,小魔驼已配送超过22万单,预计今年第四季度在商超履约配送场景实现盈利。
毫末董事长张凯表示:“毫末一直在全力以赴投入到AI自动驾驶的技术浪潮中,毫末坚持的渐进式路线与对技术投入的长期主义,让毫末模式成为中国自动驾驶发展的新范式。”
200天,通用感知实现“万物识别”
毫末CEO顾维灏表示,在自动驾驶2.0时代,以小数据、小模型为特征,以Case任务驱动为开发模式。而自动驾驶3.0时代,以大数据、大模型为特征,以数据驱动为开发模式。
毫末要做的是将车端各类小模型逐步统一为感知和认知模型、控制模块AI模型化。同时,逐步全链路模型化、大模型化,即小模型逐渐统一到大模型内。并通过剪枝、蒸馏等方式逐步提升车端的感知能力,甚至通过车云协同的方式实现远程控车。
距离今年4月发布至今,200天里DriveGPT雪湖·海若的感知、识别、4D空间重建、认知等能力大幅提升。截止10月DriveGPT雪湖·海若共计筛选出超过100亿帧互联网图片数据集和480万段包含人驾行为的自动驾驶4D Clips数据。
感知阶段,DriveGPT通过构建视觉感知大模型将真实世界建模到三维空间,并在构建对真实物理世界的4D感知基础上,进一步引入开源的图文多模态大模型,实现跟人类一样的“识别万物”的能力。此外,DriveGPT通过构建驾驶语言(Drive Language)描述驾驶环境和驾驶意图,结合导航引导信息以及自车历史动作,借助外部大语言模型LLM的海量知识辅助给出驾驶决策,进而实现“万物识别”能力。
认知大模型叠加大语言模型,自动驾驶认知决策将获得人类社会的常识和推理能力,提升自动驾驶策略的可解释性和泛化性。接下来,毫末将通过构建自动驾驶描述数据,对大语言模型进行微调,让大语言模型能够像驾校教练或者陪练一样,对驾驶行为做出更详细的解释。进而预测未来最有可能出现的各类驾驶场景,从而与各类障碍物进行更好地交互。
值得一提的是,毫末正在尝试用蒸馏的方法,也就是用大模型输出的伪标签作为监督信号,让车端小模型学习云端大模型的预测结果,或者通过对齐Feature Map的方式,让车端小模型直接学习并对齐云端的Feature Map,提升车端小模型的能力。基于蒸馏的方式,可以让车端的感知效果提升五个百分点。
从DriveGPT赋能车端的三大测试成果来看,毫末利用视觉感知模型,可以在15米范围内达到30cm的测量精度,2米内精度可以高于10cm,实现用视觉取代USS超声波雷达,降低整体智驾方案成本;同时,提升对交通场景全要素识别测试成果。DriveGPT基于通用感知的万物识别的能力,可以有效帮助毫末重感知的车端感知模型实现效果的提升,助力城市NOH的加速进城;此外,毫末在当前城市NOH的测试中,可以在城市道路场景中,在时速最高70公里的50米距离外,检测到大概高度为35cm的小目标障碍物,做到100%成功绕障或刹停,从而对道路上穿行的小动物等移动障碍物起到很好地检测保护作用。
从2019年11月正式成立至今虽不到4年,毫末智行已经在乘用车领域落地三代辅助驾驶产品HPilot。此前,已在坦克、欧拉等多款车型上搭载应用。此次,毫末推出三款千元级HPilot产品后,待未来正式上车或将进一步降低长城汽车在智驾领域的投入成本,提升市场竞争力。
智驾也拼性价比,张凯表示:“风好正扬帆,毫末人将始终秉持初心,保持创业者的激昂斗志,共同实现自动驾驶的梦想。”
文/周晶
编辑/周晶