北京青年报

蚂蚁百灵大模型通过备案，产品待上线

北京青年报客户端 2023-11-06 11:25

11月6日，蚂蚁集团透露，根据国家七部委联合公布的《生成式人工智能服务管理暂行办法》指导要求，蚂蚁百灵大模型已完成备案，基于百灵大模型的多款产品已陆续完成内测，将向公众开放。

本次通过备案的是蚂蚁百灵语言大模型，该大模型采用Transfromer架构，基于万亿级Token语料训练而成，支持窗口长度达32K，推理能力领先，在主流推理类榜单中排名前列。

据了解，蚂蚁大模型坚持自主研发、全栈布局，目前已形成包括大模型底层基础设施、基础大模型、行业大模型、应用产品在内的完整技术链条。

算力上，蚂蚁建设了万卡异构集群，其中硬件算力效率超过60%，集群有效训练时长占比90%以上，RLHF训练在同等模型效果下训练吞吐性能相较于业界方案提升3.59倍，推理性能相较于业界方案提升约2倍，处于业界先进水平。

安全力方面，蚂蚁研发了大模型安全一体化解决方案——“蚁天鉴”。“蚁鉴”平台作为业内首个大模型安全评测工具，支持50万/天饱和式攻击，全面覆盖生成内容数百类风险；“天鉴”平台可在大模型运行时，覆盖8大类风险，采用大模型对抗大模型的方式，使得风险召回率大于99%，其Guardrails前置护栏功能，能精确召回20多类提问风险意图。

知识力上，蚂蚁通过统一语料体系、数据预处理标准化、数据标注强化、评测立体化，形成了完备的知识处理能力。其中，集评测数据集与评测框架一体化的大模型评测平台—EVE，能支持语言大模型和多模态大模型一站式自动化评测。

据悉，在基础大模型层面，除了本次通过备案的百灵语言大模型，蚂蚁集团也在研发百灵多模态大模型，并已内测。

在行业大模型层面，蚂蚁集团布局了包括金融、医疗、安全等领域。今年9月，蚂蚁对外发布金融大模型及两款应用产品：面向消费者的金融智能助理“支小宝2.0”和面向行业专家的金融业务助理“支小助”。

蚂蚁集团副总裁、百灵大模型负责人徐鹏表示，蚂蚁大模型以全栈布局、长线发展为原则，以创造产业价值为目标，备案通过后，“百灵”将全线应用到蚂蚁的各个业务场景，并在各垂直领域创新研发产品，更多应用产品即将面向社会开放。

公开信息显示，蚂蚁集团基于丰富的业务场景需求，在人工智能方向持续投入，布局了包括知识图谱、运筹优化、图学习、可信AI、大模型等AI技术领域。

文/北京青年报记者温婧
编辑/田野