性能突破2EFlops!中国超算“灵晟”时隔九年再登全球之巅
2026-06-24 08:04:39未知 作者:徽声在线
文/徽声在线 记者 陈阳
6月23日,在德国汉堡举行的国际超算大会(ISC2026)上,最新一期全球超级计算机TOP500榜单正式揭晓。由中国自主研发的“灵晟”超级计算机凭借2.19EFlops(每秒219亿亿次浮点运算)的持续双精度浮点性能,成功登顶全球超算榜首。
这一突破标志着“灵晟”成为全球首台持续性能突破200亿亿次(2EFlops)的超算系统,同时也是继2017年“神威·太湖之光”之后,中国超算时隔九年再度问鼎世界第一。值得一提的是,“灵晟”也是全球第五台达到百亿亿次计算能力的超级计算机。
在本次榜单中,美国劳伦斯·利弗莫尔国家实验室的El Capitan以1.809 Exaflop/s位列第二,美国橡树岭国家实验室的Frontier则以1.353 Exaflop/s排名第三。
国家超级计算深圳中心在官方声明中强调,“灵晟”在性能上全面超越欧美E级超算,彰显了中国超算在全球竞争中的领先地位。
“灵晟”最引人注目的创新在于其技术路线的独特性。在颁奖仪式上,“灵晟”超算系统总设计师、国家超算深圳中心主任卢宇彤教授指出,超算发展已进入超智融合的新阶段。“灵晟”系统首创全CPU架构的Online Acceleration技术,突破了传统CPU-GPU异构架构的限制,通过内嵌AI矩阵加速单元,回归计算加速的本质,实现了超算、智算等多种计算模式的高效协同,为科学智能计算提供了强大支持。
从系统架构来看,“灵晟”由20480个计算节点组成,每个节点配备两颗基于ARMv9架构的LX2处理器,运行频率为1.55GHz。每颗处理器包含两个计算芯粒,每个芯粒进一步划分为四个NUMA域,每个NUMA域集成38个ARMv9核心和4GB高带宽内存,全系统共拥有近1400万个CPU核心。节点间采用国产“灵启”互连技术,通过双平面多轨胖树拓扑结构连接,每节点带宽高达1.6Tb/s;系统运行麒麟操作系统,确保了高效稳定的运行环境。
卢宇彤教授进一步介绍,“灵晟”定位为面向科学工程智能计算的国产全栈融合基础设施:
在芯片层面,自研LX2 CPU创新性引入多精度与矩阵加速能力,实现了片上超算算力与智能算力的深度融合,并集成了首颗国产HBM,内存带宽较传统CPU提升10倍;在网络层面,自主设计的灵启高速互连网络支持200万个端口、10万节点的超大规模组网;在存储层面,采用分层架构设计,兼顾高性能作业区与容量型数据区,可扩展至E级存储容量;在系统层面,构建了大规模超智融合框架,自研全栈软件,将底层硬件能力以可用、可编程、可优化的方式释放给应用,显著提升了各领域应用的性能;在节能方面,首创100%全液冷散热计算机柜,以51GFlops/W的能效比,在保持世界第一持续性能的同时,树立了绿色计算的新标杆。
全球超算算力排名解析
超级计算机作为具备极高计算速度和强大并行处理能力的计算系统,广泛应用于科学研究、气候模拟、药物研发、天体物理等领域,能够预测天气、模拟台风路径、研发新药、筛选抗癌分子等。其强大的计算能力为人类探索未知世界提供了重要工具。
回顾历史,中国超算上一次登顶TOP500榜单是在2017年。当时,“神威·太湖之光”安装于国家超级计算无锡中心,以93 Petaflop/s的Linpack成绩位居榜首,并保持了两年半的领先地位,直至2018年春季美国橡树岭国家实验室的IBM Summit系统问世。“神威·太湖之光”采用中国自主设计的“申威”系列芯片,是全球首台运行速度超过10亿亿次/秒的超级计算机,峰值性能高达12.5亿亿次/秒,持续性能达到9.3亿亿次/秒。然而,2019年美国政府对华实施制裁,限制中国获取最先进的芯片技术,此后中国停止了向TOP500提交Linpack测试结果。尽管中国仍在持续建设超算,但在近九年的时间里,TOP500榜首一直由美国和欧洲的系统占据。
如今,“灵晟”的登顶打破了这一局面,重新确立了中国在全球超算领域的领先地位。
“灵晟”超算系统总设计师、国家超算深圳中心主任卢宇彤教授
在本次TOP500榜单中,“灵晟”登顶后,其他超算的排名均顺延一位。劳伦斯·利弗莫尔国家实验室的El Capitan以1.809 Exaflop/s位列第二,橡树岭国家实验室的Frontier以1.353 Exaflop/s排名第三,阿贡国家实验室的Aurora以1.012 Exaflop/s位列第四,德国于利希超级计算中心的JUPITER Booster以1.000 Exaflop/s排名第五。前十名中还出现了一张新面孔——意大利能源公司埃尼集团的HPC7以571.5 Petaflop/s首次亮相便跻身第六。微软Azure云平台的Eagle系统降至第七,意大利埃尼的HPC6位列第八,日本的Fugaku以442 Petaflop/s排名第九,瑞士的Alps以434.9 Petaflop/s排名第十。
TOP500在新闻稿中指出,超级计算领域的高端架构正呈现出显著的多样性。从全中国自主研发的全CPU架构的“灵晟”,到配备AMD加速器的HPE Cray集群(如El Capitan和Frontier),再到采用英伟达Grace Hopper架构的JUPITER Booster和Alps,乃至搭载英特尔Ponte Vecchio GPU的Aurora系统,没有哪一种架构占据绝对主导地位。微软的Eagle集群结合了Intel Xeon处理器和Nvidia H100加速器,而日本的Fugaku则基于富士通的A64FX Arm处理器构建。“这份榜单表明,通往领先级计算领域并没有单一的主导技术路径。相反,厂商们正在探索各种CPU、GPU、APU和定制加速器方案,并结合不同的互连和系统设计。”
“灵晟”的登顶,不仅是性能的突破,更是技术路线的成功验证。在AMD与英伟达GPU对华出口禁令持续生效的背景下,中国超算选择了一条不依赖外部GPU的全CPU路径,并在全球最权威的性能榜单上证明了这条路径的可行性。这背后是芯片、互连、存储、系统软件、散热等各个环节的全面自主突破。“灵晟”的价值最终体现在应用上——在大规模并行环境下平均扩展效率达到84.4%,实现了超过千万核心的全系统高效可扩展运行。从2017年“神威·太湖之光”的93 Petaflop/s到2026年“灵晟”的2.198 Exaflop/s,中国超算在近九年的时间里完成了超过23倍的性能跃升,重新定义了全球超算的算力天花板。
本文为徽声在线独家稿件,未经授权,不得转载。
