马斯克加码算力大战!特斯拉超级计算机再砸超10亿美元,明年要跻身全球前五
澎湃新闻 2023-07-21 10:13

特斯拉将加入愈演愈烈的算力大赛。

7月20日,特斯拉CEO埃隆·马斯克在第二季度财报电话会议上透露了特斯拉超级计算机Dojo的最新进展。

“明年底之前,我们将花费远远超过10亿美元在Dojo项目上,我们有数量惊人的视频数据要进行训练。”马斯克还提到,预计将同时使用英伟达GPU和Dojo两个超算系统。

Dojo是特斯拉自研的多芯片模组化(Multi-Chip Modularized)超级计算机,于2021年的特斯拉AI日上正式亮相。最初Dojo主要服务于自动驾驶系统的数据标注以及训练,后也被应用于机器人研发,擎天柱的“大脑”中便搭载了Dojo的D1超算芯片。

在第二季度财报中,特斯拉提到,公司已经开始生产Dojo。早在今年6月份,特斯拉人工智能团队在推特上宣布,特斯拉的超级计算机Dojo将于今年7月投产,并将在2024年成为全球最先进的5台超级计算机之一。

日前,在马斯克旗下全新人工智能公司xAI的发布会上,马斯克也讨论了Dojo,他表示,虽然这台超算目前仅用于人工智能机器学习和计算机视觉培训目的,但未来会向大模型方向发力。

其实此前特斯拉已经拥有一台基于英伟达GPU的大型超级计算机来处理驾驶数据,外媒称这是世界上最强大的超级计算机之一,而Dojo使用的则是特斯拉自己设计的芯片——D1超算芯片。

D1超算芯片是Dojo系统的基础。该芯片采用7纳米制造工艺,处理能力为1024 gigaflops,即每秒1024亿次。1500枚D1芯片可组成阵列,而将25个阵列放在一块晶圆上,便能形成训练模组 (Training Tile),这便是Dojo超级计算机的单元核心。

2022年的特斯拉AI日上,特斯拉抛出了Dojo ExaPod,即Dojo集群。ExaPod内含120个训练模组 (Training Tile)、3000个D1芯片。其拥有13TB静态随机存取记忆体容量以及1.3TB高传输频宽记忆体容量,算力高达1.1EFLOP。

长期以来,特斯拉将自己定位为一家人工智能企业,而高效率的芯片与超强算力正是汽车自动驾驶、人形机器人的基础。

特斯拉方面表示,截至2023年第二季度,特斯拉FSD(Full Self-Drive,完全自动驾驶)测试版系统的总行驶里程已达到3亿英里(约4.83亿公里),并将随着测试用户规模的扩大实现指数增长,将很快达到数十亿英里,乃至数千亿英里。

得益于庞大的汽车保有量基础,特斯拉拥有远超竞争对手的数据库,其海量数据需要强大的算力支持。特斯拉表示,随着Dojo计算机的投产,更快、更便宜的神经网络训练将成为现实,特斯拉自动驾驶团队就有更大的机会迭代出新的版本方案。(澎湃新闻记者 吴遇利)

编辑/田野

最新评论