1月30日,科大讯飞举行星火认知大模型V3.5升级发布会。科大讯飞董事长刘庆峰、研究院院长刘聪正式发布基于首个全国产算力训练的讯飞星火V3.5,七大核心能力全面提升,数学、语言理解、语音交互能力超GPT-4 Turbo,重磅升级星火智慧黑板;正式发布星火语音大模型,首批37个主流语种效果超过OpenAI Whisper V3。
2023年10月24日,科大讯飞携手华为,宣布首个支撑万亿参数大模型训练的万卡国产算力平台“飞星一号”正式启用。启用后的90多天里,讯飞星火步履不停,基于“飞星一号”,启动了对标GPT-4的更大参数规模的大模型训练,带来了这场讯飞星火V3.5升级发布。
首个基于全国产算力训练的全民开放大模型讯飞星火V3.5在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力七个方面进行了全面升级。其中语言理解、数学能力超过GPT-4 Turbo,代码达到GPT-4 Turbo 96%,多模态理解达到GPT-4V 91%。
“听说今年尔滨特别火,作为南方小土豆还挺想去玩一下的。要不你用东北话介绍下有啥好玩的呗?”
在实操演示环节,科大讯飞研究院院长刘聪和讯飞星火V3.5现场互动,讯飞星火V3.5一口地道的东北话逗乐现场观众。幽默之余,讯飞星火V3.5快速为刘聪定制了旅游攻略,还催促他赶快买票,春运机票紧俏。
它不仅能够帮助用户带来解决方案,还能作为“知冷知热”的朋友,带入情绪互动,超高的拟人度让大模型更具人情味。
大模型全新赋能知识学习与内容创作。讯飞星火V3.5对年终总结计划、述职PPT、活动策划、政策问答等任务“信手拈来”。基于此,科大讯飞推出了可以一键快速自动生成文档和PPT的办公产品——讯飞智文,这款产品主要功能有文档一键生成、AI撰写助手、多语种文档生成、AI自动配图、多种模板选择、提供演讲备注功能等。刘聪现场演示了使用讯飞智文制作的“合肥市2024年春节旅游推广策略”PPT,短时间内超20页内容丰富的PPT一气呵成。
大模型还能够结合外部知识进行合理拓展,做到“旁征博引”。要素抽取、问题生成等能力的进步,能够帮助每个人以测助学形成思考的闭环,在越来越多的服务领域及学习知识场所中产生更多好用的智能体。
“大模型带来了语音技术发展的全新机会。”刘庆峰强调,让机器具备学习、推理和决策的能力,就是认知大模型要干的主要工作。“简单来说,借助大模型,我们让一段语音具备更加丰富的属性,有语种、有内容、有韵律、有音色,还有情绪。”星火语音大模型效果国际领先,中文、英语、法语、俄语等首批37个主流语种的语音识别效果超过OpenAI Whisper V3,而在多语种语音合成方面,星火语音大模型的首批40个语种拟人度超83%。
今天,在讯飞开放平台之上,大模型总开发者超35万,其中企业开发者超22万,开发者数增长迅猛,大模型应用加速落地,“所以我非常自豪,讯飞星火大模型的开发者数量,在中国是很高的,而且用户口碑非常好。”刘庆峰说道。
在此基础上,科大讯飞也在加速赋能各个行业的头部企业客户。现场,刘庆峰提及了讯飞与奇瑞的合作。“奇瑞是安徽的骄傲,连续十几年都是中国汽车出口量的第一名。”刘庆峰介绍,奇瑞汽车出口的国家覆盖英语、俄罗斯语、西班牙语、阿拉伯语、葡萄牙语等数十个语种,汽车中应用的智能语音交互技术全都由科大讯飞提供。“我们用大模型全力支撑中国汽车的全球化出海战略,要让汽车变得更聪明、更智能、更面向未来。”
会上,首个基于全国产化算力平台”飞星一号”的开源大模型——星火开源-13B正式发布。本次开源拥有130亿稠密参数(13B),包含基础模型iFlytekSpark-13B-base、精调模型iFlytekSpark-13B-chat,开源了微调工具iFlytekSpark-13B-Lora、人设定制工具iFlytekSpark-13B-Charater。学术企业研究可以基于全栈自主可控的星火优化套件,更便利地训练自己的专用大模型。
文/北京青年报记者 温婧
编辑/樊宏伟