清华系初创企业无问芯穹推出端侧开源模型
澎湃新闻 2024-12-17 10:38

欲做AI模型算力“超级放大器”、为人工智能提供设施的清华系初创企业推出端侧开源模型。

12月16日,上海无问芯穹智能科技有限公司推出端侧全模态理解的开源模型Megrez-3B-Omni,30亿参数尺寸适合手机、平板等端侧设备,具备图片、音频、文本三种模态数据处理能力。

在文本理解方面,Megrez-3B-Omni将上一代14B大模型压缩至3B规模,降低计算成本,提升计算效率。在语音理解方面,该模型支持中英文语音输入,处理复杂多轮对话场景,支持对输入图片或文字的语音提问,不同模态间自由切换。在图像理解方面,该模型在场景理解、OCR(光学字符识别)等任务上可识别并提取文本信息。同步开源的纯语言版本模型Megrez-3B-Instruct为单模态模型,最大推理速度领先同精度模型300%,具备AI搜索功能。

无问芯穹由清华大学电子工程系教授、系主任汪玉发起,他带领的NICS-EFC实验室早在2008年便投入到面向智能场景的软硬件联合优化技术路线,提出“算法创新-编译映射-硬件架构”联合优化的设计范式。联合创始人、首席科学家戴国浩毕业于清华大学电子工程系NICS-EFC实验室,现任上海交通大学长聘教轨副教授、清源研究院人工智能设计自动化创新实验室负责人。联合创始人兼CEO夏立雪是汪玉的博士生。

“我们做的主要是端侧小模型,一是因为端侧是我们的重点业务之一,另一方面也证明我们有模型训练和优化的能力。云和端一直是我们的两大业务,以前主要做云,现在开始云和端一起发力了。”无问芯穹表示,相较于云端大模型,端侧模型需要在资源有限的设备上快速部署、高效运行,对降低模型计算和存储需求提出更高要求。Megrez-3B-Omni通过软硬件协同优化策略,令各参数与主流硬件适配。该模型是能力预览,接下来还将持续迭代,未来用户只需给出简单的语音指令,就可完成端设备的设置或应用操作,该方案支持CPU、GPU和NPU同时推理,通过跨越软硬件层次的系统优化,额外带来最高70%的性能提升,最大化利用端侧硬件性能。

编辑/范辉

相关阅读
字节系大模型比同行便宜八成?火山引擎总裁:市场需要充分竞争,做得最好才能活下来
澎湃新闻 2024-12-19
豆包概念股火了 AI应用指数涨至历史高位
第一财经 2024-12-14
“无网区”变“交互区” 端侧大模型赋能汽车行业
证券日报 2024-10-25
字节布局AI硬件:首款智能体耳机售价1199元,接入豆包大模型
澎湃新闻 2024-10-10
大模型落地应用:难点与破局
新华网 2024-09-18
中国厂商与苹果竞速,AI手机进入“自动驾驶”时代
第一财经 2024-09-11
端侧大模型再进一步!荣耀、苹果纷纷加码 智能体将在手机落地
财联社 2024-09-08
面壁智能发布新一代端侧大模型
澎湃新闻 2024-09-06
最新评论