2月24日,清华大学智能产业研究院联合北京市高级别自动驾驶示范区、北京车网科技发展有限公司、百度Apollo、北京智源人工智能研究院共同正式发布首个基于真实场景的车路协同自动驾驶数据集DAIR-V2X,向境内用户提供下载使用。此次发布的数据集,首次实现在相同时空下,车端与路端联合视角的2D、3D标注方法创新,作为业界、学界首个开源车路协同数据集,将有效服务科研、产业、政府机构。
据介绍,此次发布的数据集来自北京市高级别自动驾驶示范区10公里真实城市道路、10公里高速公路、以及28个路口范围,包含来自车端、路端相机和车端、路端激光雷达等多类型传感器的71254帧图像数据和71254帧点云数据,涵盖晴天、雨天、雾天、白天和夜晚、城市道路与高速公路等丰富场景。与仅包含单车端或单路端的数据集相比,该数据集提供了相同时空下车端与路端联合视角的多模态数据,并提供了不同传感器联合视角下的融合标注结果,用于更好地服务车路协同算法研究和评估。此外,数据集通过半自动自学习车路协同3D融合标注方法等创新,有效地减少了数据集构建成本。
本次数据集的发布,为业界学界带来海量、多模态、多视角的真实场景数据,对数据进行标注、脱敏和安全加密等处理后发布,促进学术界和产业界共同推进数据驱动的车路协同自动驾驶。北京经济技术开发区管委会副主任、北京市高级别自动驾驶示范区工作办公室主任孔磊表示,“未来将及时利用数据转化制定一批车路协同数据标准,推动行业数据要素、接口、格式等标准统一,为示范区建设和行业发展提供参考和指导;通过数据开放,为高校和科研机构提供基础数据,为企业产品研发测试提供支持,有效加速产学研用协同,同时继续开展数据开放和共享服务模式探索,推动数字经济发展。”
清华大学智能产业研究院院长张亚勤认为建设高等级智能网联道路是智能驾驶及智能交通的一大趋势,既保证了智能车量产的可能性,又保障了高级别自动驾驶基于场景驱动落地的可行性。在智能交通领域,清华大学智能产业研究院已与多家企业开展校企合作,包括车路协同自动驾驶、垂直行业、小车物流、Robotaxi等应用场景。面对相关数据集的缺乏,不能满足各界实现数据驱动车路协同的现实问题,清华大学智能产业研究院发起数据集建设,并将数据集对高校、科研院所、产业用户开放,可以更好地支撑科研机构进行科学研究;同时示范区真实的数据采集、多样的场景覆盖、海量的数据样本,也可以解决企业在产品开发中的切实需求。
百度副总裁、智能交通事业部总经理尚国斌表示:“数据是自动驾驶、车路协同和智能交通等领域取得突破发展的原动力。数据的有效积累,不仅可以对同等级的算法、算力条件下的效果做质的提升,还可以自动化地识别难题、解决难题,形成人工智能‘见多识广、越用越聪明’的正向循环。”百度作为车路协同数据集建设的技术支持方表示,将持续致力于建设完善的车路协同生态,后续将逐步支持发布便于用户上手和基准复现的相关工具和代码,并开展数据集相关使用培训,以支持学术界开展车路协同相关研究。
此次发布的全球首个自动驾驶车路协同数据集DAIR-V2X目前已纳入到智源平台上,后续将依托智源社区等智源学术生态网络,面向产学研用各方加快数据集的开放、推广及应用。
文/北京青年报记者 温婧
编辑/田野