算力需求大爆发 高能耗难题何解?
21世纪经济报道 2023-09-16 13:08

作为一种新型生产力,算力已成为推动数字经济发展的核心力量,正强有力地支撑数字中国建设。在碳达峰碳中和目标引领下,如何进一步推动算力绿色化发展,实现绿色算力升级,是实现经济社会高质量发展的必然选择与关键环节。

9月12日-14日,由工业和信息化部新闻宣传中心(人民邮电报社)、中国邮电新闻工作者协会等单位联合组织的“算力中国行”大型调研采访活动走进上海。

21世纪经济报道在与当地运营商、企业、有关专家探讨中发现,伴随算力规模爆炸式增长,如何处理数据中心“快发展”和“高耗能”之间的矛盾变得越发急迫。目前从地方到企业也在尝试优化制冷系统、加强应用环节效率、完善能效评估体系等多种举措,为绿色算力发展提供了更多的行业参考。

图片来源:缴翼飞 摄

降能耗不能忽视制冷系统

国际能源机构(IEA)的数据显示,2022年全球数据中心用电量为2400亿~3400亿千瓦时,约占全球最终电力需求的1%~1.3%。根据中国信通院统计,我国2022年数据中心能耗总量1300亿千瓦时,同比增长16%,预计到2030年,能耗总量将达到约3800亿千瓦时。

目前业内普遍认为,从能耗构成看,数据中心总能耗包括IT设备、制冷系统、供配电系统、照明和其它。制冷是IT设备之外的最大耗能源。因此,优化制冷系统成为数据中心提高能源效率的重要环节。

在上海移动临港IDC数据中心里,“全副武装”的新型微模块机房成为一个个节能环保的“绿色单元”,记者走在通道中也感受到了明显的低温凉爽。据工作人员介绍,在上海移动临港数据中心,末端机房采用微模块R18标准建设,符合数据中心未来发展要求的模块化、标准化、低碳化的智能管理要求,可实现节能减排、化整为零、方便运维的管理效果。

“相较于传统机房,微模块通过最新的冷通道封装技术,加强了供冷效率和换热效率,再加上水冷空调的应用以及智能化空调群控系统的采用,大大提高了微模块供冷的能效比。”该工作人员说。

除此以外,上海移动还采用机房制冷精细化管理模式,在秋冬季节利用大气自然冷源代替冷机机械制冷,在夏季供冷高峰时期通过智能监测室外环境温度和末端供冷需求量,通过冷机、水泵、冷却塔风机动态变频调节模式运行,全年可节电超过200万度。

值得注意的是,液冷、间接蒸发冷、全变频氟泵等先进技术正逐步应用于数据中心,均可有效减少数据中心制冷方面的用电,提升制冷效率,助力PUE值持续降低。

国内三大运营商中国移动、中国电信和中国联通今年6月发布的《电信运营商液冷技术白皮书》中也指出,目标2025年50%以上数据中心项目应用液冷技术,电信行业力争成为液冷技术的引领者、产业链的领航者、推广应用的领先者。

记者在燧原科技还看到了采用冷板式液冷方案的云燧智算机,可组建面向超大模型的算力集群,刚刚在2023年中国算力大会上被评为“算力中国·年度突破成果”。目前,燧原科技已在之江实验室建成了千卡液冷训练集群,在提供超过100P国产AI算力的同时,还可将PUE降至1.1以下,实现了高算力和绿色化的结合。

《2023中国绿色算力发展研究报告》预计,到2030年,液冷技术规模落地后PUE接近1,单位能耗碳排放随着绿电在电网中占比不断提高将有所下降。

上海市通信管理局信息通信发展处副处长魏征告诉记者,目前上海正在推动液冷、间接蒸发自然冷却等节能技术的应用,并在嘉定、青浦等地区的算力中心开展试点。同时,还在推动数据中心企业启动氢燃料电池等绿电在数据中心的试点,梳理了上海10个“小散老旧”数据中心(约4000个标准机架),预计将于年底前全部完成数据中心改造任务。

值得注意的是,不少企业正在尝试利用AI来实现架构和算法上的优化,以最大限度地利用活动设备,并将不需要的设备置于深度空闲/低功耗状态,以提升使用效率,降低电量的需求。

蚂蚁集团首席技术官、平台技术事业群总裁何征宇告诉记者,算力是由数据中心的服务器提供,但实际上大量的电能只是用于维持服务器在正常运转,并没有提供直接的计算服务。根据统计数据,在目前的数据中心里,可能只有6%-12%的电能是真正用于计算本身。

他进一步指出,不同类型业务在不同时段存在业务量潮汐波动属性。例如,在线服务类业务具有高敏感和低时延的属性要求,离线计算(如AI模型训练、数据挖掘等)对时延和敏感性要求低,但对计算能力和存储空间要求较高等。由此,不同工作负载类型对硬件算力需求不一,如在线业务CPU利用率不高、离线计算CPU利用率高、智能计算业务对于CPU要求不高但对于GPU要求高等,都给异构硬件算力资源的采购、调配和复用等带来一定挑战。

据了解,蚂蚁集团2022年的服务器CPU效率已经从2017年的不足10%,提升到了33%。未来随着智算需求的提升也会在GPU方面作进一步的尝试。

能效评估体系仍有完善空间

作为衡量数据中心能效水平的重要指标,PUE成为近年来行业中最为人耳熟能详的热词。

近年来,国家和地方发布多项政策不断推动PUE值的降低,2021年11月,国家发改委联合网信办、工信部、能源局共同发布《贯彻落实碳达峰碳中和目标要求推动数据中心和5G等新型基础设施绿色高质量发展实施方案》中提到,全国新建大型、超大型数据中心平均电能利用效率降到1.3以下,国家枢纽节点进一步降到1.25以下;工信部印发《新型数据中心发展三年行动计划(2021—2023年)》提出,到2023年底,新建大型及以上数据中心PUE降到1.3以下。

在调研走访过程中,很多企业均表示,不同于自然冷源对西部PUE降低给予的极大助力,上海地区的机房能够满足PUE达到1.3以下的条件,但也面临着不小的成本压力。

“目前智算中心建立落地以后,前期的服务器的功耗由原来的将近1千瓦,现在大概在11千瓦的水平。在这种情况下,实际上对能耗的指标的需求也会越来越大,希望能在能耗指标等政策上给予统筹支持。”一位运营商如此说道。

事实上,数据中心服务器运行的过程中会产生大量热能,水冷目前成为东部服务器比较普遍的方法,这也会造成较大的水力消耗。

何征宇认为,当前行业比较关注数据中心的绿色度指标,并且已经制定了一系列比较成熟的评价指标及相应的评估体系,如电能利用效率PUE、水资源利用效率WUE、碳利用效率CUE 等,都在推动数据中心绿色化过程中发挥了巨大作用。同样,面向应用环节的计算绿色化,也需要制定出相应的评价指标和评估体系,才能有效帮助算力应用企业一方面更好评估自身当前算力效用水平,另一方面也可以更好地评估出在该领域的投入产出效果。

也有部分企业建议,未来的产业政策中可以在能耗指标上向智算中心有所倾斜,同时优化绿色能源的能耗管理方式,对于在数据中心所用的绿色能源,不再纳入能耗总量和强度控制,用能管理逐渐从能耗“双控”向碳排放“双控”转变。

编辑/樊宏伟

最新评论