北京青年报

算力投入巨大高端AI服务器市场需求激增

中国证券报 2023-12-20 10:32

“过去一台AI服务器装四张显卡，现在客户要的都是能装八张甚至十张显卡的高端设备。”12月18日，在2023AITechDay暨首届人工智能生态发展峰会现场，服务器厂商正展示全新升级的AI大模型服务器。中国证券报记者在现场了解到，AI大模型迭代速度越来越快，厂商对智能算力投入大幅增加，支持存储和训练的高端AI服务器的需求激增。不少AI服务器厂商今年订单都集中在高端AI服务器上。

业内人士表示，随着AI大模型加速迭代，智能算力已成为稀缺资源。未来较长一段时间内，我国AI服务器市场维持供不应求状态，国产AI芯片市场规模增长迎来关键窗口期。

高端AI服务器抢手

当前，大模型厂商产品迭代如火如荼。据百川智能创始人、CEO王小川介绍，目前百川大模型保持每个月一次模型数据的迭代。

AI大模型正带动AI服务器算力需求持续扩张。安擎计算机相关负责人告诉记者，2023年，由于行业投资趋于谨慎，判别式AI应用场景收缩，AI服务器市场整体销售台数同比有所下降，但订单金额同比将会呈现增长态势。这是由于AI大模型算力需求集中爆发，成为智能算力的最大需求方。

“AI大模型厂商都在加快迭代速度，客户根本等不起你去建机房，而是希望拎包入住。”鸿博股份副总裁、英博数科CEO周韡韡告诉记者，“我们现在都是找一些已经建好的机房，然后把设备放进去，快速组网，调试好后交付给客户。AI大模型的发展让人看到的不仅是效率提升，似乎全行业迭代周期都在缩短。”

高端AI服务器设备十分紧俏。“大模型训练所需数据激增，AI大模型厂商需要的是能够支持存储和训练的高端AI服务器。因此各服务器厂商目前都在升级芯片规格、扩大卡组数量，向高端AI服务器方向升级。”上述安擎计算机相关负责人称。

我国智能算力资源稀缺。艾瑞咨询发布的《2023年中国智能计算中心行业发展白皮书》显示，2022年，中国智能算力规模占全部算力的比重为22%；从服务器结构来看，2022年，我国通用服务器占服务器总量比重为93.2%，而AI服务器仅占服务器总量的6.8%。多位业内人士表示，未来较长一段时间内，我国AI服务器市场维持供不应求状态。

算力产业链迎利好

随着AI大模型算力需求强劲，今年以来，国内算力产业链公司接连斩获新订单。

12月4日，鸿博股份公告称，子公司英博数科向百川智能提供一定规模的英伟达智算服务器，及其所有的算力资源以及配套软件应用和技术服务，涉及交易总金额预计达313.82亿元。据周韡韡介绍，截至2023年12月，英博数科累计签约额超18亿元。

公开资料显示，神州数码在10月29日至11月19日期间共签订四笔销售神州鲲泰品牌昇腾AI服务器订单，合同总金额达6.24亿元。

青云科技10月15日公告称，公司向高新兴讯美科技股份有限公司采购6.84亿元GPU服务器（含配套产品），并与客户签订6.90亿元销售合同，向其销售上述GPU服务器（含配套产品）。

在AI大模型浪潮的带动下，人工智能芯片、服务器、数据中心市场规模将显著提升。IDC预计，2023年中国人工智能芯片出货量将达到133.5万片，同比增长22.5%。

人工智能服务器方面，IDC预计，2023年中国人工智能服务器市场规模将达到91亿美元，同比增长82.5%；2027年将达到134亿美元，年均复合增长率为21.8%。

智算中心建设步伐加快。据不完全统计，截至2023年8月，全国已有超过30个城市建设智算中心。

中信证券表示，AI的持续发展拉动智能算力需求和建设水平提升，为光模块、服务器等领域带来持续增长机会。

做好生态建设

AI大模型时代，进口品牌GPU等高端芯片供应面临周期波动挑战，为国产AI芯片加速推向市场打开关键窗口。不过，AI大模型的训练、推理和海量数据存储无一不需要高性能算力支撑，也对国产算力底层基础设施能力和生态建设提出考验。

艾瑞咨询产业数字化研究院负责人徐樊磊表示，在AI大模型爆发之前，国内的智能算力资源主要用于推理端。AI大模型趋势到来，使国内厂商开始推出训练端的算力硬件产品和服务，但目前相关产品能力比起全球领先算力能力仍有较大差距。

业内人士表示，在计算层面，由于芯片厂商在开发过程中使用的技术路线不同，导致芯片适配服务器等设备的开发周期普遍很长。在训练层面，单芯片算力有限，而大模型训练需要大规模的算力集群，需要算力系统具有灵活的算力扩展能力。在存储层面，多模态大模型的训练和推理对存储提出了更高要求。

近年来，我国AI算力市场高度依赖英伟达GPU硬件和相应的软件生态。周韡韡坦言，全球90%的AI工程师都在使用英伟达GPU配套的CUDA软件生态，这和英伟达GPU在全球的垄断地位完全匹配。“一些国产GPU计算性能并非绝对不够，而是若要把国产GPU和基于CUDA架构开发的设备进行适配，需要在调试和优化上花费大量精力，导致用户使用算力的效率下降。”

然而，随着英伟达芯片进口难度不断提升，国产AI芯片自主创新任重道远。

记者梳理发现，浪潮信息、海光信息、希姆计算、中科通量、瀚博半导体、墨芯人工智能、摩尔线程、天数智芯、寒武纪、燧原科技等芯片公司推出了应用于不同场景的AI推理和训练任务的芯片加速卡，涉及CPU、GPU、RISC-V等不同设计架构。

海光信息表示，海光DCU兼容CUDA生态，对文心一言等大多数国内外主流大模型适配良好。依托DCU可以实现LLaMa、GPT、Bloom、ChatGLM、悟道、紫东太初等为代表的大模型全面应用。

如何进一步提升国产AI芯片竞争力？中国工程院院士、清华大学教授郑纬民认为，要开发基于国产AI芯片的系统，这一过程中最重要的是做好生态建设。“国产AI芯片只要达到国外芯片60%的性能，如果生态做好了，客户也会满意。”郑纬民称。

徐樊磊建议，做好自主创新要从人才、设施、科研和生态领域四方面突破，逐步提升智能算力设备软硬件功能。在硬件方面，提高国产AI芯片的稳定性和兼容性，特别是提升芯片之间、服务器集群之间的数据传输效果。在软件生态方面，降低适配门槛，让开发者逐渐使用国产芯片生态。

编辑/范辉