奇富科技亮相INTERSPEECH 2024大会 方言识别技术全球领先
北京青年报客户端 2024-10-08 18:58

近日,奇富科技受邀出席了在希腊举办的国际语音通信与信号处理顶级会议INTERSPEECH 2024,并发表了题为《Qifusion-Net:基于特征融合的流式/非流式端到端多口音语音识别框架》的主旨演讲,展示了其在语音识别技术领域的成就。

微信图片_20241008190818.jpg

INTERSPEECH作为全球语音科学界最负盛名的年度会议之一,汇聚了来自世界各地的顶尖学者、研究人员及行业领袖,共同探讨语音技术的最新进展、挑战与未来趋势。在演讲中,奇富科技介绍了可同时支持20多种方言的新一代奇富语音识别系统“QiFree”,这是国内金融行业内字错率最低的中文语音识别系统。QiFree打破了单一模型只能识别特定单一方言的困境,通过创新的层自适应融合结构,借助共享信息编码模块更高效的提取方言信息,实现了即说即译,进一步增强了语音机器人的实时交互能力。值得一提的是,QiFree不仅在普通话识别领域的CER上保持领先地位,更在冀-鲁、江淮、胶-辽、兰-银等多个方言区域的识别性能上,相比过往最佳成绩实现了超过15%的显著提升。

在中文口音与方言语音识别领域的权威测试集KeSpeech的对比中,奇富科技实现了方言口音分类准确率的显著提升,达到了79.10%,远超KeSpeech的基线水平61.13%。同时,在衡量识别错误率的关键指标——CER(字符错误率)上,奇富科技更是以8.08%的成绩,远优于KeSpeech的10.38%,展现了其在中文方言识别领域的高效与精准。

“百里不同俗,十里不同音”,我国幅员辽阔,方言种类丰富,方言的语法和语音特征差异显著,加之噪声干扰、方言混杂、主观感知的标注问题,以及人力标注工作的庞大和系统性不足,导致语音识别技术的准确性和智能化水平受限。特别是在金融业务场景中,市面上的通用语音识别技术在应对方言时常常表现不佳,导致人机交互的准确性和智能性大打折扣,服务效率和质量受损。为此,奇富科技推出自研的中文语音识别系统“QiFree”,将其集成到智能营销及贷后提醒等业务场景中,以有效解决地区口音差异带来的挑战。

文/北京青年报记者 温婧
编辑/田野

相关阅读
涵盖超级计算、大模型、6G等前沿技术领域 20个项目获颁“2024年世界互联网大会领先科技奖”
北京青年报客户端 2024-11-20
更有温度的数字人亮相2024服贸会 引领全球服务贸易数智化浪潮
北京青年报客户端 2024-09-14
奇富科技亮相2024服贸会 AI大模型助力金融业智能化升级
北京青年报客户端 2024-09-12
AI合成郭德纲、于谦外语说相声,技术能否真正改变文艺创作传播方式?
上观新闻 2023-11-02
奇富科技徐庆宏:打击金融黑灰产需合力共治
北京青年报客户端 2023-09-11
教AI认手语的年轻人,借助科技力量,试图让更多聋人被“听见”“听懂”
新华每日电讯 2021-12-29
“百度语音输入”全面赋能,罗技推出多国语言、多地方言语音输入鼠标
北京青年报客户端 2021-04-14
人脸识别+VR技术 港媒:中国高科技加入“垃圾战”
参考消息网 2019-07-21
最新评论