我国多数模型使用的中文数据占比超60% 部分已达80%
北京青年报客户端 2025-08-14 11:24

8月14日,国新办举行“高质量完成‘十四五’规划”系列主题新闻发布会。国家数据局相关部门负责人介绍“十四五”时期数字中国建设发展成就,并答记者问。

国家发展改革委党组成员、国家数据局局长刘烈宏在新闻发布会上表示,大家非常关心中文数据占训练数据的比重问题,经过一段时间的努力,国内多数模型使用的中文数据占比已超过60%,有的模型已达到80%。中文高质量数据的开发和供给能力持续增强,使得我国模型性能快速提升。

文/北京青年报记者 熊颖琪
编辑/马晓晴

相关阅读
国家数据局:全国医保码用户超12亿
北京青年报客户端 2025-08-14
2024年全国数据企业数量超40万家
北京青年报客户端 2025-08-14
我国人工智能专利数量占全球总量的60%
北京青年报客户端 2025-08-14
国家数据局:数据产权等10多项制度将在今年推出
北京青年报客户端 2025-08-14
国家数据局:我国算力总规模位居全球第二
北京青年报客户端 2025-08-14
国家税务总局:年收入居前10%群体,缴纳的个税占比约九成
新华社客户端 ​ 2025-07-28
国家税务总局:年收入居前10%的群体,缴纳个税占比约9成
北京青年报客户端 2025-07-28
提前完成目标!“十四五”以来累计吸收外资已超7000亿美元
央视新闻客户端 2025-07-18
最新评论