7月26日至29日,2025世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2025)在上海举行。期间,“科大讯飞高级别高水平多语言基座大模型国际学术研讨会”举办。各国专家共商推进多语言AI技术普惠发展新路径,探索构建更加公平包容的全球AI治理体系,以技术创新助力“全球南方”国家跨越数字鸿沟,充分展现产学研协同创新的国际合作格局。
由于数字化语料稀缺,全球主流大模型对低资源语言的支持严重不足,小语种国家面临AI边缘化风险。如何弥合这一数字鸿沟,成为此次研讨会各国专家共同关注的核心议题。
“我们希望构建全方位的多语言大模型及其应用,给世界提供第二种选择。”科大讯飞研究院院长刘聪在主题演讲中表示,最新升级的星火大模型X1可以支持130+语种,在阿语、德语、法语、韩语、日语等重点语种中整体效果已超过GPT-4.1。通过混合语种路由等技术创新,星火语音大模型支持100个语种语音识别,整体效果超过Whisper V3,星火语音合成大模型支持55个语种语音合成。
英国萨里大学“以人为本的人工智能研究中心”联合主任宋一晢教授认为,人工智能的终极目标是服务人类价值、赋能每一个个体,这要求AI必须要围绕人的体验、创造力与福祉设计,同时也必须是可接触、可控制、对所有人都有益,而不是只属于少数人。
宋一晢称,多语言AI犹如现实版的“巴别鱼”——源自科幻小说《银河系漫游指南》中那种能实时翻译任何语言的神奇生物,正在打破人们之间的语言隔阂。他介绍了团队开发的DemoFusion与NitroFusion技术,能够在一块普通GPU上运行超高清、实时的生成式AI模型,让每一位创作者都能在本地设备上拥有“超级计算能力”。
匈牙利语言学研究中心总干事Gábor Prószéky教授强调,数据质量优于数据体量,是构建可信大语言模型的关键。团队开发的PULI模型家族已促成与中国AI同行的合作,通过HuGME评估框架实现了从训练、语料建设到实际应用的完整闭环。
塞尔维亚诺维萨德大学技术科学学院主任Vlado Delić教授指出,塞尔维亚语在通用模型中token占比不足0.1%,远低于斯洛文尼亚语。“语言模型不能只服务大语种,每种语言都应拥有体现其文化身份的大模型。”
以色列人类语言技术协会创始人兼董事Avner Algom分享了希伯来语AI技术发展经验。他指出,希伯来语虽是世界上唯一被成功复兴为现代口语的古老语言,但在自然语言处理领域仍属低资源语言。语言服务不能只为大语种设计,小语种也应拥有技术平权。
通过这次研讨会,各国专家达成共识:在全球化深入发展的今天,多语言大模型不仅是技术创新的成果,更是推动文明交流互鉴、构建人类命运共同体的重要工具。中国经验也为世界AI发展提供了宝贵的“第二种选择”,让每种语言——无论大小——都能拥有反映其文化身份的大语言模型,为全球数字文明的繁荣发展注入了新的动力。
文/北京青年报记者 宋霞
编辑/胡克青