11月6日,蚂蚁集团透露,根据国家七部委联合公布的《生成式人工智能服务管理暂行办法》指导要求,蚂蚁百灵大模型已完成备案,基于百灵大模型的多款产品已陆续完成内测,将向公众开放。
本次通过备案的是蚂蚁百灵语言大模型,该大模型采用Transfromer架构,基于万亿级Token语料训练而成,支持窗口长度达32K,推理能力领先,在主流推理类榜单中排名前列。
据了解,蚂蚁大模型坚持自主研发、全栈布局,目前已形成包括大模型底层基础设施、基础大模型、行业大模型、应用产品在内的完整技术链条。
算力上,蚂蚁建设了万卡异构集群,其中硬件算力效率超过60%,集群有效训练时长占比90%以上,RLHF训练在同等模型效果下训练吞吐性能相较于业界方案提升3.59倍,推理性能相较于业界方案提升约2倍,处于业界先进水平。
安全力方面,蚂蚁研发了大模型安全一体化解决方案——“蚁天鉴”。“蚁鉴”平台作为业内首个大模型安全评测工具,支持50万/天饱和式攻击,全面覆盖生成内容数百类风险;“天鉴”平台可在大模型运行时,覆盖8大类风险,采用大模型对抗大模型的方式,使得风险召回率大于99%,其Guardrails前置护栏功能,能精确召回20多类提问风险意图。
知识力上,蚂蚁通过统一语料体系、数据预处理标准化、数据标注强化、评测立体化,形成了完备的知识处理能力。其中,集评测数据集与评测框架一体化的大模型评测平台—EVE,能支持语言大模型和多模态大模型一站式自动化评测。
据悉,在基础大模型层面,除了本次通过备案的百灵语言大模型,蚂蚁集团也在研发百灵多模态大模型,并已内测。
在行业大模型层面,蚂蚁集团布局了包括金融、医疗、安全等领域。今年9月,蚂蚁对外发布金融大模型及两款应用产品:面向消费者的金融智能助理“支小宝2.0”和面向行业专家的金融业务助理“支小助”。
蚂蚁集团副总裁、百灵大模型负责人徐鹏表示,蚂蚁大模型以全栈布局、长线发展为原则,以创造产业价值为目标,备案通过后,“百灵”将全线应用到蚂蚁的各个业务场景,并在各垂直领域创新研发产品,更多应用产品即将面向社会开放。
公开信息显示,蚂蚁集团基于丰富的业务场景需求,在人工智能方向持续投入,布局了包括知识图谱、运筹优化、图学习、可信AI、大模型等AI技术领域。
文/北京青年报记者 温婧
编辑/田野