​“面向新一代国产E级超级计算系统的十大应用挑战”发布
科技日报 2021-12-09 16:03

12月8日,国家超级计算天津中心和国防科技大学,联合数十家合作团队,共同发布“面向新一代国产E级超级计算系统的十大应用挑战”,支撑解决世界科技前沿、经济主战场、国家重大需求、人民生命健康领域的重大挑战性问题。

据介绍,新一代百亿亿次(E级)高性能计算机的研发,是国家在新一代信息技术领域的重要部署,将有力驱动国家信息技术产业创新发展,其自主化程度远高于其他超算平台,同时规模与性能更是大幅提升。此次十大应用挑战的发布,其目的就是为了充分发挥新一代E级高性能计算机强大计算能力,研发适配国产超级计算系统的关键技术和应用软件,构建新的国产E级超级计算应用生态。

挑战一:磁约束聚变堆全装置聚变模拟(人造小太阳)

可控聚变能源被认为是人类未来应对能源和环境挑战最有效的手段之一,而在磁约束聚变装置设计中,最重要的问题就是如何用更低的成本约束住更高密度、温度的等离子体。

目前被广泛认可的一个主要限制约束性能的机制是边界和芯部产生的所谓微观不稳定性。在先前的研究中由于多时间尺度的问题,这些不稳定性通常采用回旋动理学或磁流体力学等简化模型来描述,并且等离子体芯部和边界需要分别建模。

在新一代国产E级计算机上,将可以直接采用电磁全动理学这一经典等离子体最基本的模型来直接模拟可分辨离子回旋半径的磁约束聚变堆全装置等离子体,并且不用区分边界与芯部。借助几何算法,使系统长期演化模拟结果的可靠性可以得到保证,更准确而自洽地再现其内部所发生的不稳定性过程,寻求提升磁约束聚变装置约束性能的机制。

此外,全装置等离子体动理学模拟还能得到对装置尺度的等离子体演化更加保真的模型,更好地指导未来磁约束聚变堆等离子体的设计,将为可控聚变研究和聚变能源开发提供强力支撑。

挑战二:全尺寸航空航天飞行器超百亿网格计算流体力学模拟

近年来的临近空间飞行器复杂流动问题数值研究对认识高空高速下的流动机理起到了重要作用。临近空间飞行器飞行包络覆盖连续流域、滑移流域和过渡流域,存在复杂的气动力热、稀薄非平衡效应、大动压下的多体分离、化学反应、等离子体等跨流域非定常多场耦合现象。

上一代超级计算机在计算能力和架构设计上无法进行满足精度和效率要求的临近空间飞行器跨流域非定常多场耦合模拟,而新一代国产E级超级计算机在理论上有望突破计算瓶颈,从而实现超百亿网格高精度全尺寸这一模拟。

临近空间飞行器跨流域非定常多场耦合模拟研究一方面可以帮助我们全面认识飞行器在高空高速飞行状态下的复杂耦合流动现象,并辨识流动机制及其对飞行器的影响,另一方面可以拓展新一代超级计算机上的数值风洞构建能力,为航天各类运载飞行器和航空国产大飞机等设计提供载体,使其更好地服务于我国战略发展和建设。

挑战三:数字细胞超亿级原子体系动力学模拟

在解读生命奥秘特别是细胞生物机理方面,全原子分子动力学模拟的虚拟实验作用日益凸显。

细胞内充斥了各种各样的生物大分子和小分子,始终处于一种动态的拥挤环境中,而拥挤环境对生物分子的扩散、聚集、构象变化和化学反应都会有显著影响。因此,在细胞尺度上对生物体系进行全原子分子动力学模拟将是认知生命过程的重要手段,但是目前的计算机很难提供足够的算力来实现。

国产新一代的E级超级计算机理论上可以实现超亿级甚至十亿级原子数字细胞的分子动力学模拟,使得未来细胞水平上的精准模拟成为可能。对细胞进行全原子分子动力学模拟,将使我们可以在虚拟实验中对整个细胞及其内外的生物大分子的微观动态过程进行高时空分辨的观察,帮助我们全面深刻地去认识新冠病毒等如何侵入细胞、细胞如何进行物质信息交换等生命科学重大挑战性问题。

通过数字模拟获得的知识,也将对未来的新药研发、生命健康保障起到奠基性的作用。

挑战四:对流尺度次公里级精细化数值天气预报

对于尺度较小、发展剧烈的强对流天气系统,往往难以预报,且容易造成破坏性灾害,对于大城市的运行管理带来很大的威胁。

随着天气系统时空尺度的缩小,大气的混沌属性越发明显,预报的不确定性加剧,这为精细化天气预报带来了很大的挑战,目前基于探测技术的预警时效性和对系统演变的预测往往不足。

基于新一代国产E级超级计算机的强大计算能力,综合超高分辨率模拟、集合预报、快速循环等技术,提前0-6小时预报强对流天气的触发、演变、消亡,为单个对流系统提供连续、概率性的预测,改进强对流引发的局地强降水、冰雹、突发大风、龙卷的时空落区预报准确性。

挑战五:百亿级高效高通量虚拟药物筛选

先导结构的发现和优化作为新药发现阶段的研究核心,往往需要花费数年时间以及高达数亿美元的资金,是药物研发的关键技术瓶颈。因此如何生成新分子及优化分子的关键属性(如生物活性、成药性、安全性和选择性等)是影响药物分子设计成败的两个关键问题。

据估计,目前可利用的化学空间大小范围约为10^23至10^60,即便是某些成熟数据库的小分子数量也达到十亿级别。如何在如此巨大的化学空间内如何进行分子的智能生成、结构的快速演化搜索和性质预测是药物筛选所面临的巨大挑战。

目前,药物筛选通常可以利用分子对接等相对粗略的方法,在之前的超级计算机上已经可以实现对十亿级别的小分子进行快速的初筛,再利用更为精确的自由能扰动计算等方法进行更为准确的评价分析。

新一代E级超级计算机提供的强大算力能够支撑百亿级别药物小分子的快速筛选,辅以更先进的算法,可以实现虚拟药物筛选效能几十乃至上百倍的提升;同时高效的药物筛选,还可以与中药有效组分发现结合,推动中药研发的现代化。

挑战六:面向通用人工智能的超大规模预训练模型

深度神经网络是新一代人工智能的领航区,并且已经成功应用于计算机视觉和自然语言处理等领域,取得了突出成效。

随着应用场景的丰富和发展,传统基于有标注数据集的领域模型训练和应用范式越来越无法适用人工智能应用的开发和普及。基于无标注数据的自监督学习技术和综合能力好、通用能力强的大规模预训练模型的出现,将数据驱动的深度学习技术和通用人工智能推向新的发展阶段。

近年来,计算机和人工智能领域的专家和企业已经在利用现有高性能计算机上完成了 1.75 万亿参数的多模态预训练模型开发,而国产新一代 E 级超级计算机使得支撑参数规模更大、通用性更强的模型(十万亿甚至百万亿以上)的训练和应用成为可能。

大规模预训练模型的研发部署,一方面,将推动类人机器人加快落地;另一方面,有通用模型做基础,将大幅降低细分领域数据向智能化模型转化的难度,有效推动人工智能应用基础设施的构建,提升工业现代化、数字经济发展、智能社会数字化治理能力。

挑战七:FAST超大规模观测数据的高分辨率巡天图像处理

中性氢巡天是 “中国天眼”(FAST射电望远镜)的重要科学目标之一,通过探测可观测宇宙范围内中性氢的分布情况,为宇宙起源与演化、暗物质与暗能量等前沿科学领域的研究提供支撑。

受视场所限,望远镜每次观测只能覆盖有限天区,中性氢巡天观测持续时间可达数年,所积累的观测数据需拼接融合才能获得完整的高分辨率巡天图像。在中性氢巡天数据处理流程中,网格化(Gridding)是计算量最大且I/O最为密集的环节,是制约中性氢巡天数据处理与成果产出效率的瓶颈。

新一代E级超级计算机的数据处理能力配合高性能网格化算法,能够应对PB量级的中性氢巡天观测数据,从而为国之重器“中国天眼”能够“早出成果、多出成果,出大成果、出好成果”提供强大助力,促生天文学基础与前沿领域的重大发现。

挑战八:全球尺度地震全波形反演

地震全波形反演是当前分辨率最高的成像方法,是研究地球内部结构和动力学演化过程的强有力工具,还可为矿产资源和油气勘查提供关键支撑。

在过去十年里,地震科学领域专家已经在上一代超级计算机上实现了区域尺度的低频带弹性波全波形反演研究。

国产新一代的E级超级计算机将可以实现全球尺度的、包括地震波衰减特征在内的高频带粘弹性地震波场传播模拟和波形成像研究。全球尺度高频带粘弹性地震波形反演一方面可以获得地球内部高精度成像结果,加深我们对板块构造、俯冲带和造山带形成和演化的认识,另一方面可以提供地球内部各圈层(中下地壳、岩石圈、软流圈等)物质和能量交换的地震学证据,为研究地球深部成矿作用和火山/地震活动提供依据,帮助人类更全面的认知地质演化,理解类地行星的形成发展。

挑战九:全脑千亿神经元动力学仿真

近年来的神经科学研究获取了大量的大脑结构和活动的数据,以此来理解大脑的工作机制。对于大脑的高级功能,如运动控制和思考等功能的解析和再现,迫切需要建立起人类全脑规模的仿真神经网络平台。

人类的大脑有860亿神经元,在过去的十年里,计算神经科学领域的专家在上一代的超级计算机上已经进行了人脑百分之一大小规模的脑回路仿真。而新一代的E级超级计算机在理论可以实现包括大脑皮层、小脑和基底神经节在内的全脑神经回路的模拟。

人类全脑回路的仿真和研究,一方面在可以帮助我们理解大脑的思考等高级功能,开发类脑人工智能算法。另一方面,帕金森症,亨廷顿舞蹈症等大脑疾病的发病机理也将能够得到进一步的分析和验证。此外,使用仿真脑模型构建基于脉冲神经网络的神经模态机器人,能够提升现有机器人系统的感知与决策水平。

挑战十:完全分辨率的全球次中尺度海洋数值模拟

气候变化是全球可持续发展所面临的重大挑战,也是科学界面临的最具挑战性的科学问题之一,海洋则是控制气候系统季节内、季节、年际、年代际变率的重要分量。

近年来,随着海洋观测的飞速发展,海洋中尺度、次中尺度过程的许多机理被不断揭示,海洋多尺度相互作用的特征更加清晰,对海洋环流数值模拟也提出了更高的要求,分辨率中尺度、次中尺度过程及其与大气的相互作用成为重要的研究方向。

在过去的10年期间,全球的科学家在此方向作出了不懈努力,将全球的海洋模拟提高到部分分辨率次中尺度涡(2km)的分辨率,而我国的科学家也自主开发了全球3-5km的海洋模式,基本可以完全分辨开阔大洋的中尺度过程。新一代的E级超级计算机可以实现完全分辨率次中尺度过程的模拟,帮助科学家全面理解海洋内部多尺度相互作用过程,以及海洋能量串级过程,并进一步提高对海洋环流以及整个气候系统的模拟能力。

文/科技日报记者 陈曦

编辑/范辉

最新评论