北京青年报

亚马逊“云计算春晚”大爆猛料：采用GH200超级芯片、发布聊天机器人

财联社 2023-11-29 13:50

当地时间周一（11月27日），有“云计算春晚”之称、为期四天的“re:Invent”在美国拉斯维加斯盛大开启。周二，亚马逊与其云计算部门AWS都各自公布了重磅消息。

在AWS这边，其发布了升级版的自研处理器芯片“Graviton4”。新闻稿称，与上一代Graviton3相比，其计算性能提高了30%，内核增加了50%，内存带宽增加了75%，为在亚马逊EC2中运行的云工作负载提供最佳的性价比和能效。

Graviton4 和 Trainium

AWS还发布了面向人工智能系统的升级款加速器芯片“Trainium2”。介绍称，其训练速度是上一代Trainium1的四倍，并且能够组合在超过10万个芯片的EC2 UltraCluster中，“使基础模型（FM）和大型语言模型（LLM）的训练只需极少的时间，同时能效将提升至2倍。”

据了解，Trainium2将于2024年投入应用，可能取代AWS中部分英伟达的AI加速器产品，但这不意味着亚马逊和英伟达分道扬镳。在会议上，英伟达CEO黄仁勋和AWS CEO Adam Selipsky一起上台，宣布两家公司“扩大战略合作关系”。

最新的合作包括，AWS将成为第一家采用英伟达GH200 Grace Hopper Superchip平台的云服务提供商，该平台可以集成32个Grace Hopper超级芯片在一个封装“GH200 NVL32”中。配备亚马逊云技术后，服务可以扩展到数千个GH200芯片。

另外，两家公司将合作在AWS上托管英伟达的多节点AI训练即服务解决方案“NVIDIA DGX 云”，它也将成为第一个采用GH200 NVL32的DGX云。两者还在Ceiba项目上进行合作，设计全球最快的、GPU驱动的AI超级计算机，英伟达计划使用它来推动下一波生成式AI的创新。

AWS还将推出三个新的Amazon EC2实例，分别为P5e、G6和G6e，三者都将由英伟达的GPU提供支持。其中，G6e特别适合使用英伟达的平台“NVIDIA Omniverse”来开发3D工作流程、构建数字孪生和其他应用程序。

除此以外，AWS CEO Adam Selipsky还发布了一款名为“Q”的聊天机器人，专门供人们在工作中使用，并且可以根据客户的业务进行定制。新闻稿称，用户可以使用Q在AWS上构建应用程序、研究最佳实例、解决错误以及获得编写新功能的帮助。

编辑/范辉