5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo。同天,“通义千问APP”更名为“通义APP”,集成通义大模型全栈能力,免费为所有用户提供服务,包括文生图、智能编码、文档解析、音视频理解、视觉生成等。
相比通义千问2.1版本,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%,中文能力更是持续领先业界。在权威基准OpenCompass上,通义千问2.5得分追平GPT-4 Turbo,是该基准首次录得国产大模型取得如此出色的成绩。
通义还发布了最新款开源模型,1100亿参数的Qwen1.5-110B,该模型在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型。
通义APP以性能媲美GPT-4 Turbo的基模为底座,并把通义实验室前沿的文生图、智能编码、文档解析、音视频理解、视觉生成等能力集合,致力于称为每个人的全能AI助手。
通义APP拥有超强文档处理能力,单次可处理多达1000万字的长文档,还能同时解析100份不同格式的文档,是金融、法律、科研、医疗、教育等领域专业人士的工作提效利器;基于通义大模型出色的音视频理解能力,通义APP能够精准高效地进行音视频文件的识别理解、摘要总结、多语言翻译,可同时上传处理50个音视频文件;通义APP还集成了国内最受欢迎的智能编码助手通义灵码,能帮助所有人随时随地在手机上写代码、读代码、学习编程技能。
今年以来,通义APP先后推出了“全民舞王”、“全民唱演”、“通义照相馆”、AI智能体等现象级应用,在“全民舞王”频道,用户上传一张照片就能跳“科目三”等舞蹈;在“全民唱演”频道,用户用一段音频就能驱动肖像照中的人物唱歌说话。这些热门应用背后都是通义实验室自研的前沿AI模型,阿里云方面表示,未来,通义APP还将推出更多以新技术驱动的新玩法,让所有人都能获得最领先的大模型技术体验。
文/北京青年报记者 温婧
编辑/田野