国内首次!百度智能云点亮昆仑芯三代万卡集群
北京青年报客户端 2025-02-05 21:48

2月5日,百度智能云成功点亮昆仑芯三代万卡集群,这也是国内首个正式点亮的自研万卡集群。据悉,百度智能云将进一步点亮3万卡集群。这一重大突破标志着百度在人工智能算力领域迈出了坚实的一步。

在过去一年中,整个行业都在努力降低大模型的使用成本,而算力紧张是导致成本居高不下的重要因素之一。百度通过自研芯片和大规模集群的建设,不仅解决了自身算力供应的问题,还为整个行业提供了新的思路和方向。

从算力上看,超大规模并行计算能力可实现训练效率跃升,万卡集群可将千亿参数模型的训练周期大幅降低,满足AI原生应用快速迭代的需求。同时也能支持万亿参数模型、复杂任务和多模态数据,支撑Sora类应用的开发。此外,万卡集群能够支持多任务并发能力,通过动态资源切分,单集群可同时训练多个轻量化模型,通过通信优化与容错机制减少算力浪费,实现训练成本指数级下降。

随着国产大模型的兴起,万卡集群逐渐从“单任务算力消耗”到“集群效能最大化”过渡,通过模型优化、并行策略、有效训练率提升、动态资源分配等手段,智能调度任务,将训练、微调、推理任务混合部署,从而提升集群综合利用率,降低单位算力成本。

中国工程院院士、清华大学计算机系教授郑纬民也表示,当下构建国产自主万卡系统充满挑战,但“至关重要”。万卡集群部署过程中,存在巨大挑战,百度表示,24年9月升级的百度百舸AI异构计算平台4.0,在万卡集群的建设中发挥了至关重要的作用。它突破硬件扩展性瓶颈,如卡间互联的拓扑限制,避免通信带宽成为瓶颈;同时,围绕芯片及集群功耗,基于万卡规模常规方案功耗可达十兆瓦或更高,采用创新性散热方案,从而解决万卡集群的能效与散热问题。针对机间通信带宽需求,建设超大规模HPN高性能网络,优化拓扑结构,从而降低通信瓶颈,带宽有效性达到90%以上。

日前,花旗银行发布研报表示,DeepSeek、百度等中国模型展现出高效和低成本优势,将有助于加速全球AI应用开发,并在全球引发更多技术创新,推动2025年人工智能应用的拐点。

文/北京青年报记者 温婧
编辑/刘忠禹

相关阅读
百度智能云千帆大模型产业(北京)创新基地落地石景山区
北京青年报客户端 2024-11-05
百度文心大模型日均调用量超7亿次,旗舰模型一年降价超90%
北京青年报客户端 2024-09-25
百度2025届校招将发3000+Offer,约80%为AI相关技术岗位
北京青年报客户端 2024-09-21
腾讯发布星脉网络2.0 让AI大模型训练效率提升20%
北京青年报客户端 2024-07-01
腾讯文生文模型将开源 下一代视频模型时长将超30秒
第一财经 2024-05-21
百度王海峰:百度人工智能专利申请量、授权量国内第一
北京青年报客户端 2024-04-26
有望打败闭源模型?阿里、百度、腾讯云厂商抢食开源Llama 3算力
第一财经 2024-04-23
苹果手机将搭载百度AI技术?百度人工智能A股小伙伴有这些
财联社 2024-03-25
最新评论