半两财经|智源:FlagOS完成DeepSeekV4八款芯片Day0适配,实现三重技术突破
北京青年报客户端 2026-04-25 11:42

4月24日,DeepSeek发布了两款新模型,分别是高性能的DeepSeek-V4-Pro和高性价比的DeepSeek-V4-Flash。由智源研究院牵头研发的众智FlagOS第一时间对这两款模型进行适配,已完成DeepSeek-V4-Flash在8款以上AI芯片上的全量适配与推理部署,包括海光、沐曦、华为昇腾、摩尔线程(FP8)、昆仑芯、平头哥真武、天数、英伟达(FP8)等芯片。FlagOS同时正在推进DeepSeek-V4-Pro模型在多个芯片的迁移适配,后续即将开源。

受访者供图

DeepSeek-V4-Flash是一款兼顾性能与效率的模型,能够处理超长文本内容,适配效果出色。为了让这款模型能在更多芯片上稳定运行,而非只能在少数高端芯片上使用,FlagOS实现了三项关键技术突破。

第一,FlagGems实现了多芯片统一适配,无需各芯片厂商单独适配,就能让模型在不同芯片上正常运行,大幅降低了适配难度和成本。

第二,通过优化技术,解除了芯片使用数量的限制,让更多主流国产芯片都能顺利运行这款模型,扩大了模型的适用范围。

第三,解决了模型精度适配问题,让原本只能在最新高端芯片上运行的模型,也能在各类主流国产芯片上稳定运行,且不影响使用效果。

据介绍,FlagOS适配后的模型,使用效果和原生版本一致,且开发者可以直接使用,无需复杂配置。此次适配依托FlagOS的技术底座,大幅缩短了适配时间,同时FlagOS坚持开源,为开发者提供便利,助力大模型在更多芯片上普及使用。

文/北京青年报记者 温婧
编辑/刘忠禹

相关阅读
AMD发布新系列AI芯片MI350 称新芯片性能优于英伟达
第一财经 2025-06-13
2025北京智源大会开幕 智源发布“悟界”系列大模型
北京青年报客户端 2025-06-06
摩尔线程GPU芯片 从跟跑到并跑
北京青年报客户端 2025-04-02
大模型浪潮下迎算力巨变 上海芯片企业争做AI“潮人”
第一财经 2025-03-14
高端算力中心少、智算成本高 两会代表委员为AI发展“开药方”
第一财经 2025-03-10
半两财经 | Manus创造DeepSeek时刻? 北京如何打造AI原生城市
北京青年报客户端 2025-03-07
“一石激起千层浪” DeepSeek赋能 AI普惠化发展提速
中国青年报 2025-02-25
备案上线大模型105款 北京期待下一个AI新星诞生| 北京经济新航标
北京青年报客户端 2025-02-19
最新评论