北京青年报

小语种国家如何拥抱人工智能 “中国经验”提供第二种选择

北京青年报客户端 2025-07-30 11:26

7月26日至29日，2025世界人工智能大会暨人工智能全球治理高级别会议（WAIC 2025）在上海举行。期间，“科大讯飞高级别高水平多语言基座大模型国际学术研讨会”举办。各国专家共商推进多语言AI技术普惠发展新路径，探索构建更加公平包容的全球AI治理体系，以技术创新助力“全球南方”国家跨越数字鸿沟，充分展现产学研协同创新的国际合作格局。

由于数字化语料稀缺，全球主流大模型对低资源语言的支持严重不足，小语种国家面临AI边缘化风险。如何弥合这一数字鸿沟，成为此次研讨会各国专家共同关注的核心议题。

“我们希望构建全方位的多语言大模型及其应用，给世界提供第二种选择。”科大讯飞研究院院长刘聪在主题演讲中表示，最新升级的星火大模型X1可以支持130+语种，在阿语、德语、法语、韩语、日语等重点语种中整体效果已超过GPT-4.1。通过混合语种路由等技术创新，星火语音大模型支持100个语种语音识别，整体效果超过Whisper V3，星火语音合成大模型支持55个语种语音合成。

英国萨里大学“以人为本的人工智能研究中心”联合主任宋一晢教授认为，人工智能的终极目标是服务人类价值、赋能每一个个体，这要求AI必须要围绕人的体验、创造力与福祉设计，同时也必须是可接触、可控制、对所有人都有益，而不是只属于少数人。

宋一晢称，多语言AI犹如现实版的“巴别鱼”——源自科幻小说《银河系漫游指南》中那种能实时翻译任何语言的神奇生物，正在打破人们之间的语言隔阂。他介绍了团队开发的DemoFusion与NitroFusion技术，能够在一块普通GPU上运行超高清、实时的生成式AI模型，让每一位创作者都能在本地设备上拥有“超级计算能力”。

匈牙利语言学研究中心总干事Gábor Prószéky教授强调，数据质量优于数据体量，是构建可信大语言模型的关键。团队开发的PULI模型家族已促成与中国AI同行的合作，通过HuGME评估框架实现了从训练、语料建设到实际应用的完整闭环。

塞尔维亚诺维萨德大学技术科学学院主任Vlado Delić教授指出，塞尔维亚语在通用模型中token占比不足0.1%，远低于斯洛文尼亚语。“语言模型不能只服务大语种，每种语言都应拥有体现其文化身份的大模型。”

以色列人类语言技术协会创始人兼董事Avner Algom分享了希伯来语AI技术发展经验。他指出，希伯来语虽是世界上唯一被成功复兴为现代口语的古老语言，但在自然语言处理领域仍属低资源语言。语言服务不能只为大语种设计，小语种也应拥有技术平权。

通过这次研讨会，各国专家达成共识：在全球化深入发展的今天，多语言大模型不仅是技术创新的成果，更是推动文明交流互鉴、构建人类命运共同体的重要工具。中国经验也为世界AI发展提供了宝贵的“第二种选择”，让每种语言——无论大小——都能拥有反映其文化身份的大语言模型，为全球数字文明的繁荣发展注入了新的动力。

文/北京青年报记者宋霞
编辑/胡克青