我国多数模型使用的中文数据占比超60% 部分已达80%
北京青年报客户端 2025-08-14 11:24

8月14日,国新办举行“高质量完成‘十四五’规划”系列主题新闻发布会。国家数据局相关部门负责人介绍“十四五”时期数字中国建设发展成就,并答记者问。

国家发展改革委党组成员、国家数据局局长刘烈宏在新闻发布会上表示,大家非常关心中文数据占训练数据的比重问题,经过一段时间的努力,国内多数模型使用的中文数据占比已超过60%,有的模型已达到80%。中文高质量数据的开发和供给能力持续增强,使得我国模型性能快速提升。

文/北京青年报记者 熊颖琪
编辑/马晓晴

最新评论