DeepSeek吹响“集结号” 国产AI生态伙伴火速适配
证券时报网 2025-02-06 10:16

证券时报记者 阮润生

国产开源大模型DeepSeek凭借出色性价比,成为全球增速最快的AI应用,引发全球科技圈热切讨论和算力信仰震荡,也进一步增强对构建开放型人工智能生态的信心。目前,不仅英伟达、AMD、英特尔等国际芯片巨头宣布集成DeepSeek模型、提供算力支持等,国产GPU厂商、云计算厂商和应用厂商等AI产业链伙伴也火速支持调用DeepSeek,升级各自产品和技术。

引发算力巨震

作为幻方量化旗下的AI公司深度求索研发的国产开源大模型,DeepSeek近期连续发布的DeepSeek V3、DeepSeek-R1等AI模型展示了惊艳效果和低廉的训练成本。移动应用分析机构SensorTower的数据显示,其应用软件在18天内的下载量达到1600万次,截至2025年2月4日,DeepSeek日活用户数超越了2000万,成为全球增速最快的AI应用。

人工智能业内人士向证券时报记者表示,DeepSeek证明了不用堆叠算力也可以搞好大模型。

综合来看,DeepSeek提供了一种高效的模型蒸馏技术,能够将大规模模型的能力迁移至更小、更高效的版本,并且通过Multi-Head Latent Attention(MLA)和DeepSeek MoE两大核心技术,显著降低显存占用,优化模型性能。

TrendForce集邦咨询研究指出,DeepSeek采用蒸馏模型(Model Distillation)技术,压缩大型模型以提升推理速度并降低硬件需求,同时充分发挥英伟达Hopper降规版芯片的效益,最大化运算资源利用。其成本优势来自高效能硬件选择、新型蒸馏技术及API开源策略,不仅优化技术与商业应用的平衡,也展现AI产业向高效发展的趋势。

DeepSeek成为现象级AI应用,也引发了对算力信仰的质疑。全球算力巨头英伟达股价1月27日一度下跌近17%,之后逐步企稳;A股光通信模块龙头中际旭创1月27日下跌约10%,2月5日进一步放量下跌,工业富联下跌6.76%,寒武纪-U下跌12.46%。

对此,英伟达此前发表声明,表示DeepSeek所取得的进展显示出其芯片在中国市场的实用价值,且未来为满足DeepSeek的服务,还将需要更多英伟达芯片。

TrendForce集邦咨询最新指出,DeepSeek模型虽降低AI训练成本,但AI模型的低成本化可望扩大应用场景,进而增加全球数据中心建设量。光收发模块作为数据中心互连的关键组件,将受惠于高速数据传输的需求,预测2023年400Gbps以上的光收发模块全球出货量为640万个,2024年约2040万个,预估至2025年将超过3190万个,年增长率达56.5%。

AI芯片积极适配

对DeepSeek的认可不仅体现在排行榜和用户下载量上,也反映在国际AI芯片巨头的兼容和本土厂商的积极适配。

1月31日,英伟达发布搭载DeepSeek-R1 671b的“英伟达NIM微服务”预览版,显著提升AI模型的运行效率,简化企业部署流程,降低AI落地的技术门槛。

另外,AMD已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上;英特尔也表示其开发的AI芯片/GPU芯片可以支持DeepSeek,有意与中国芯片合作打破英伟达打造的生态垄断。

据业内分析,DeepSeek使用了英伟达的PTX(Parallel Thread Execution)语言,实现在接近汇编语言的层级运行,通过允许进行细粒度的优化,能够对GPU硬件进行更底层、更精准的控制。

前述业内人士向记者表示,能够使用PTX证明DeepSeek有能力做到更底层的技术,本质上对国产GPU也是好事。有分析指出,通过精通运用PTX语言,有望帮助国产GPU进行针对性算子优化,提升模型在国产GPU上的运行效率。

除了国际巨头,海光信息作为国产AI芯片企业,2月4日晚宣布成功完成DeepSeekV3和R1模型与海光AI加速卡DCU的适配并正式上线,有望推动AI技术在更多行业的落地与普及。2月5日,该公司股价上涨11.19%。

另外,潞晨科技携手华为昇腾,联合发布基于昇腾算力的DeepSeek-R1系列推理API及云镜像服务,实现了昇腾算力与DeepSeek-R1系列模型的推理适配优化,性能表现与使用高端GPU持平。另外,DeepSeek系列模型正式上线昇腾社区,支持一键获取DeepSeek系列模型,支持昇腾硬件平台上开箱即用,推理快速部署。

国产GPU厂商沐曦宣布与DeepSeek的合作,摩尔线程宣布部署DeepSeek蒸馏模型推理服务,提升了DeepSeek模型的计算效率和资源利用率;天数智芯宣布适配DeepSeek-R1千问蒸馏模型,提供更高效、更稳定的推理服务,满足了不同规模和需求的应用场景。

2月5日,壁仞科技宣布自主研发的壁砺TM系列产品完成对DeepSeek-R1全系列蒸馏模型的支持,涵盖了从1.5B到70B各等级参数版本,包括LLaMA蒸馏模型和千问蒸馏模型,为开发者提供高性能、低成本的大模型部署与开发解决方案。

云厂商及应用端接入

除了AI硬件端厂商,不少云计算巨头也纷纷入围DeepSeek“朋友圈”,华为云、腾讯云、阿里云、百度云等已经宣布支持部署DeepSeek模型。另外,联通云宣布已基于星罗平台实现国产及主流算力适配多规格DeepSeek-R1模型,兼顾私有化和公有化场景,提供全方位运行服务保障,为客户带来开箱即用的使用体验;实现多产品场景调用,可在全国270多个骨干云池预部署,全面接入联通云桌面、编程助手等多产品场景;提供全方位安全服务保障,实时提供抗DDoS等三大安全服务并具备元景安全大模型加持。

除了云厂商,应用端厂商也在积极探索和部署DeepSeek模型。

2月4日,万兴科技表示,已完成深度求索(DeepSeek)最新推理大模型DeepSeek-R1的深入适配,旗下视频创意、绘图创意及文档创意软件业务产品,诸如万兴喵影、亿图图示、亿图脑图MindMaster、万兴PDF等均已融合DeepSeek-R1大模型相关能力,用户可抢鲜体验。接入DeepSeek-R1后,用户使用产品的门槛降低,大模型应用的成本也进一步降低。

另外,北信源公众号显示,其自主研发的“密信AI能力平台”第一时间完成了与DeepSeek的技术对接,这一举措将为信源密信和第三方应用提供DeepSeek大模型AI能力;奇安信宣布已完成与DeepSeek全面深度接入,自研的QAX—GPT安全大模型通过DeepSeek-R1优化和蒸馏后,运营成本大幅降低,在威胁研判等多场景下的性能显著提升,安全专业问答整体性能分数提升约16%。

当虹科技官微显示,公司BlackEye多模态视听大模型正式融合DeepSeek-R1和DeepSeek Janus Pro,并完成视听传媒、工业与卫星、车载智能座舱等多行业垂类场景的数据调优训练,可为视听传媒、工业与卫星、车载智能座舱等行业客户提供更低成本的大模型部署及全新的大模型体验。

易点天下宣布,旗下KreadoAI、数眼智能、zMaticooADX等多款核心产品将融合DeepSeek-R1大模型相关能力,提升用户智能营销体验。

就“公司AI产品有没有与DeepSeek模型合作或使用”等问题,盛天网络2月5日在互动平台回复,公司目前已有相关合作,正在进行对接使用DeepSeek模型。公司通过在线API接口以及对开源模型进行私有化部署的方式开展工作,目前已部署完成进入测试阶段。公司预计DeepSeek模型后续可应用于公司社交产品带带和给麦,以探索更优质的产品与服务,并进一步提高公司各项业务生产力,结合公司弹性算力池有效降低算力成本。目前公司一款底层对接DeepSeek的社交小游戏已完成了一轮内部测试。

据中文在线消息,基于DeepSeek V3与R1提出的技术路线,中文在线正着力研发并训练升级版“中文逍遥”,以进一步提升该大模型的创作能力。

2月5日,阅文集团宣布旗下作家辅助创作产品——作家助手已集成独立部署的DeepSeek-R1大模型。阅文邀请全行业网文作家参与,用户下载作家助手至最新版本即可试用并参与内测。

此外,2月5日,华为终端BG首席执行官何刚在微博发文透露,华为小艺助手已接入DeepSeek,小艺App的智能体广场已上线DeepSeek-R1的Beta版,升级至原生鸿蒙系统可以体验。

编辑/范辉

最新评论