据美国科技网站The Information报道,由于设计缺陷,英伟达下一代Blackwell架构系列AI旗舰芯片GB200的出货时间,将被推迟至少三个月。
而微软、谷歌、Meta等英伟达大客户已订购了价值数百亿美元的Blackwell系列芯片,这一推迟恐将引起一系列“蝴蝶效应”。
量产前发现设计缺陷
英伟达在今年3月发布了Blackwell系列,首席执行官黄仁勋在5月时还信心满满地表示,公司计划在今年晚些时候开始批量出货Blackwell系列芯片。
GB200芯片包含两个相连的Blackwell GPU和一个Grace中央处理单元。然而,在最近几周台积电工程师为量产进行准备时,却在连接两个Blackwell GPU的裸晶上发现了设计缺陷。这一缺陷会导致芯片良率或产量降低,通常做法是停止量产。
因此,英伟达不得不对芯片设计进行调整,并在开始量产前,与台积电合作进行新的试生产。
芯片出货延迟并非闻所未闻,但在即将量产前发现重大设计缺陷的情况还是非常罕见的。
台积电原本计划在第三季度开始量产Blackwell系列芯片,并从第四季度开始向英伟达客户批量发货。然而,由于设计缺陷的发现,量产时间不得不推迟到第四季度,批量出货的时间预计要推迟到明年第一季度。台积电为量产GB200保留了产能,但在问题解决之前,不得不让产线闲置。
打乱微软、谷歌和Meta计划
对于云服务商而言,收到芯片后通常需要三个月左右的时间才能让大型计算集群投入运行,这意味着一些原计划在2025年第一季度部署的项目可能会受到影响。
这一延迟无疑打乱了英伟达客户的计划,特别是对于微软、谷歌和Meta这样的巨头来说。谷歌已经订购了40多万颗GB200芯片,加上服务器硬件,订单成本可能远远超过100亿美元。Meta也下了一份价值至少100亿美元的订单。
而微软最近几周的订单规模也增加了20%,他们原本计划在明年1月份前向OpenAI提供由基于Blackwell系列芯片的服务器,但现在可能至少要推迟到明年3月。
AI企业原本期望在2025年第一季度就能在其数据中心运行由Blackwell系列芯片驱动的大型集群,实现计算能力飞跃,从而更好地生成AI回答、视频或执行任务。
然而,现在他们不得不面对芯片交付推迟的现实,这可能会影响到ChatGPT、Meta AI以及其他未来几代大模型和AI应用的开发进度。
雪上加霜
据知情人士援引英伟达告诉云服务商的话,英伟达可能会考虑生产只包含一个Blackwell GPU的芯片版本,以避免缺陷,加快芯片的出货速度。
英伟达不愿对向客户发送的延迟通知置评。但表示,客户目前正在测试Blackwell芯片的样品,生产正按计划在今年晚些时候进行。
加上美国司法部正在对英伟达进行反垄断调查,这一推迟无疑是“雪上加霜”,给英伟达的股东们带来了不小的打击。他们原本对Blackwell芯片寄予厚望,期待它能推动英伟达的数据中心收入实现大幅增长。
黄仁勋在5月的分析师电话会议上说:“今年我们将会有大量的Blackwell系列芯片收入。”
Keybanc Capital Markets的一位分析师此前预计,Blackwell芯片将推动英伟达的数据中心收入从2024年的475亿美元增长到2025年的2000多亿美元。然而,这一乐观的预测显然没有考虑到新的延迟出货因素。
编辑/樊宏伟