阿里千问3开源,成本低于DeepSeek,奥数水平刷新开源记录
北京青年报客户端
2025-04-29 12:44
4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),参数量仅为DeepSeek-R1的1/3,成本大幅下降,性能全面超越R1、OpenAI-o1等全球顶尖模型。
千问3在推理、指令遵循、工具调用、多语言能力等方面均大幅增强:在奥数水平的AIME25测评中,千问3斩获81.5分,刷新开源纪录;在考察代码能力的LiveCodeBench评测中,千问3突破70分大关,表现甚至超过Grok3;在评估模型人类偏好对齐的ArenaHard测评中,千问3以95.6分超越OpenAI-o1及DeepSeek-R1。性能大幅提升的同时,千问3的部署成本还大幅下降,仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。
所有千问3模型都是混合推理模型,API可按需设置“思考预算”(即预期最大深度思考的tokens数量),进行不同程度的思考,灵活满足AI应用和不同场景对性能和成本的多样需求。比如,4B模型是手机端的绝佳尺寸;8B可在电脑和汽车端侧丝滑部署应用;32B最受企业大规模部署欢迎,有条件的开发者也可轻松上手。
据悉,阿里通义已开源200余个模型,全球下载量超3亿次,千问衍生模型数超10万个,已超越美国Llama,成为全球第一开源模型。此次千问3系列模型依旧采用宽松的Apache2.0协议开源,并首次支持119多种语言,全球开发者、研究机构和企业均可免费在魔搭社区、HuggingFace等平台下载模型并商用,也可以通过阿里云百炼调用千问3的API服务。个人用户可立即通过通义APP直接体验千问3。
文/北京青年报记者 温婧
编辑/刘忠禹
相关阅读
Meta 重磅发布!
证券时报网 2025-04-06
DeepSeek官宣V3小版本升级强在哪 被赞“开源里程碑”
第一财经 2025-03-26
百度发布两款大模型 对标DeepSeek、聚焦多模态
第一财经 2025-03-16
清华大学与瑞莱智慧联合团队推出RealSafe-R1大模型
北京青年报客户端 2025-02-24
全球科研团队竞逐低成本AI模型研发新范式
新华社 2025-02-24
李彦宏:从DeepSeek学到一件事,开源最佳模型能大大促进人们使用
澎湃新闻 2025-02-19
资源紧张!微信用户对DeepSeek搜索热情超预期
第一财经 2025-02-19
经济日报:DeepSeek能否开启全民AI时代
经济日报 2025-02-16
最新评论