AI芯片H100的热度还没过,芯片巨头英伟达(Nasdaq:NVDA)又打出一张新王牌——H100的升级版。
当地时间11月13日,英伟达正式宣布,在目前最强AI(人工智能)芯片H100的基础上进行一次大升级,发布新一代H200芯片。H200拥有141GB的内存、4.8TB/秒的带宽,并将与H100相互兼容,在推理速度上几乎达到了H100的两倍。H200预计将于明年二季度开始交付,英伟达尚未公布其价格。
英伟达还透露,下一代Blackwell B100 GPU也将在2024年推出,性能已经“望不到头”。
英伟达预计在2024年推出H200和B100两款芯片 来源:英伟达官网
与作为前辈的A100和H100相比,H200最大的变化就是内存。搭载“世界上最快的内存”HBM3e技术的H200在性能上得到了直接提升,141GB的内存几乎是A100和H100最高80GB内存的2倍,4.8TB每秒的带宽则达到了A100的2.4倍,也显著高于H100 3.35TB每秒的带宽。
英伟达表示,根据使用Meta的70B大模型Llama 2进行的测试,H200的输出速度几乎是H100的两倍。基于与H100相同的Hopper架构,H200将具有H100的一切功能,例如可以用来加速基于Transformer架构搭建的深度学习模型的Transformer Engine功能。
根据官方发布的图片,H200在大模型Llama 2、GPT-3.5的输出速度上分别是H100的1.9倍和1.6倍,在高性能计算HPC方面的速度更是达到了双核x86 CPU的110倍。
来源:英伟达官网
英伟达加速计算总经理兼副总裁伊恩·巴克 (Ian Buck)表示:“要利用生成式AI和高性能计算HPC来构建智能,需要利用大容量、超高速的GPU内存来高速快速地处理大量数据。英伟达H200将为业界领先的端到端AI超级计算平台进一步加速,以解决一些世界上最重要的挑战。”
从今年年初起,英伟达股价已经上涨了超230%,截至11月14日,公司总市值达到1.2万亿美元。当天,英伟达股价在H200发布后一度涨超490美元,全日收于486.2美元,涨0.59%,盘后涨0.3%,股价实现九连涨。
美国知名经济评论员吉姆·克雷默(Jim Cramer)表示,英伟达最新的高端芯片可能会为其股价提供推动力,帮助其在生成式AI热潮中进一步上涨。
此前,根据瑞杰金融(Raymond James)统计的数据,H100芯片的价格已经到达了25000美元到40000美元之间,而一个AI训练过程需要数千个这样的芯片协同工作。在当下的AI热潮中,这也使得H100成为了硅谷最抢手的“硬通货”。
科技网站The Verge表示,最关键的问题在于英伟达能否为市场提供足够的H200,或者它们是否会像H100一样在供应量上受到限制。而对于这点,英伟达并没有给出明确的答案,只表示公司正在与“全球系统制造商和云服务提供商”合作来供应这些芯片,亚马逊、谷歌、微软和甲骨文等云服务商将是明年二季度首批使用H200的公司之一。
另外,英伟达竞争对手AMD已经在英伟达之前抢先推出了最新AI芯片MI300X,高达192GB的HBM3内存,5.2TB/秒带宽。此前,AMD表示,公司正在今年第三季度向客户提供样品,产量将在第四季增加。预计AMD将在北京时间12月7日凌晨举办的“Advancing AI”特别活动上正式发布MI300X GPU。
值得一提的是,此前有消息称,英伟达已开发出针对中国市场的最新改良版系列芯片——HGX H20、L20 PCle和L2 PCle。知情人士称这三款芯片由H100改良而来,英伟达最快或将于本月16号之后公布。澎湃新闻记者采访了多位产业链人士,均证实英伟达改良版芯片属实。英伟达官方尚未对此作出评论。
今年10月17日, 美国商务部工业和安全局(BIS)发布了针对芯片的出口管制新规,尤其是对高算力的AI芯片进行了更严格的管控。其中一个很重要的新规定就是调整了先进计算芯片受限的标准,设置了新的“性能密度阈值”来作为参数。
10月31日,中国贸促会新闻发言人张鑫表示,美方新发布的对华半导体出口管制规则,进一步加严了人工智能相关芯片、半导体制造设备对华出口的限制,并将多家中国实体列入出口管制“实体清单”。美国这些措施严重违反了市场经济原则和国际经贸规则,加剧了全球半导体供应链撕裂与碎片化风险。美国自2022年下半年开始实施的对华芯片出口禁令正在深刻改变全球供需,造成2023年芯片供应失衡,影响了世界芯片产业格局,损害了包括中国企业在内的各国企业的利益。
英伟达将于美国时间11月21日盘后发布2023财年第三财季财报。根据美国投资研究公司Zacks Investment Research的数据,预计调整后的每股收益(EPS)将达到3.01美元,去年同期为0.34美元。
编辑/樊宏伟