在11月12日举行的第三届中国超级算力大会(ChinaSC 2021)上,由中科院计算技术研究所研究员张云泉、清华大学教授陈文光、美国阿贡国家实验室Pavan Balaji研究员和瑞士苏黎世实验室Torsten Hoefler教授联合ACM SIGHPC China委员会共同发起的国际人工智能算力性能排行榜——AIPerf500发布。
这是AIPerf500第二次发榜。榜单显示,首届AIPerf500的榜单冠军“鹏城云脑II”蝉联榜首,AIPerf得分为194527.5TOPS;排在其后的是一台新一代神威高性能计算机,AIPerf得分为53704.5TOPS;联泰集群研制的一台智算设备位列第三。
“鹏城云脑II”是鹏城实验室与华为联合打造的人工智能大科学装置,用以AI领域诸如计算机视觉、自然语言处理、自动驾驶、智慧交通、智慧医疗等各类基础性研究与探索。硬件方面,“华为鲲鹏920+昇腾910”的CPU+AI加速芯片的组合,铸就“鹏城云脑II”强大的人工智能算力。在今年国际超算大会最新一期的IO500排行榜中,“鹏城云脑II” 蝉联全系统输入输出和10节点规模系统两项世界冠军。
相比首届,今年AIPerf500榜单共新增15台机器。其中,新增4台机器进入前10名,13台机器进入前20名。新增计算系统中,北京超级云计算中心贡献的数量最为可观。
张云泉介绍称,目前AIPerf500榜单的上榜机器均来自国内,新增机器数量“不及预期”。但他也表示,受新冠疫情等各种因素影响,大家对将这一测试标准推向国际化的难度是有心理准备的,“后续还将继续努力”。
谈及为何要推动这样一个人工智能算力基准测试程序,张云泉称有两方面原因。一是公众需要一个简单明晰的指标来回答“ 哪套计算系统的人工智能算力更强”“ 整个智能计算领域的发展状况如何”等问题,二是传统的高性能计算机测试结果与人工智能需要的性能不完全一致,高性能计算算力测试程序主要评测双精度浮点数运算能力,而 人工智能训练以单精度浮点数或16位浮点数为主、推理以8位整数计算为主,因此需要一种新的评测标准。
连续两届,AIPerf测试程序虽有小的瑕疵,但总体还是经受住了考验。“AIPerf已经可以在多种主流的高性能异构系统下稳定运行并评分,并可支持4千张加速卡以上级别的大规模评测,且能有效区分出不同规模系统的AI算力差异。”张云泉说。
会上,清华大学副教授翟季冬发布了用于评测计算机系统训练大模型能力的测试模型AIPerf-MoE。该模型规模可变、并行模式可调、支持混合精度,能适应不同系统内存、不同网络拓扑及不同计算硬件,可根据系统大小弹性测试上述能力。
目前,AIPerf500 全新网站“aiperf.org”已上线。网站以英文内容呈现,人们可以登陆该网站了解AIPerf、查看AIPerf500榜单,并可在帮助文档指引下在人工智能算力设备运行AIPerf测试程序,并测定评分。
编辑/范辉