性能突破2EFlops！中国超算“灵晟”时隔九年再登全球之巅

2026-06-24 08:04:39未知作者:徽声在线

文/徽声在线记者陈阳

6月23日，在德国汉堡举行的国际超算大会（ISC2026）上，最新一期全球超级计算机TOP500榜单正式揭晓。由中国自主研发的“灵晟”超级计算机凭借2.19EFlops（每秒219亿亿次浮点运算）的持续双精度浮点性能，成功登顶全球超算榜首。

这一突破标志着“灵晟”成为全球首台持续性能突破200亿亿次（2EFlops）的超算系统，同时也是继2017年“神威·太湖之光”之后，中国超算时隔九年再度问鼎世界第一。值得一提的是，“灵晟”也是全球第五台达到百亿亿次计算能力的超级计算机。

在本次榜单中，美国劳伦斯·利弗莫尔国家实验室的El Capitan以1.809 Exaflop/s位列第二，美国橡树岭国家实验室的Frontier则以1.353 Exaflop/s排名第三。

国家超级计算深圳中心在官方声明中强调，“灵晟”在性能上全面超越欧美E级超算，彰显了中国超算在全球竞争中的领先地位。

“灵晟”最引人注目的创新在于其技术路线的独特性。在颁奖仪式上，“灵晟”超算系统总设计师、国家超算深圳中心主任卢宇彤教授指出，超算发展已进入超智融合的新阶段。“灵晟”系统首创全CPU架构的Online Acceleration技术，突破了传统CPU-GPU异构架构的限制，通过内嵌AI矩阵加速单元，回归计算加速的本质，实现了超算、智算等多种计算模式的高效协同，为科学智能计算提供了强大支持。

从系统架构来看，“灵晟”由20480个计算节点组成，每个节点配备两颗基于ARMv9架构的LX2处理器，运行频率为1.55GHz。每颗处理器包含两个计算芯粒，每个芯粒进一步划分为四个NUMA域，每个NUMA域集成38个ARMv9核心和4GB高带宽内存，全系统共拥有近1400万个CPU核心。节点间采用国产“灵启”互连技术，通过双平面多轨胖树拓扑结构连接，每节点带宽高达1.6Tb/s；系统运行麒麟操作系统，确保了高效稳定的运行环境。

卢宇彤教授进一步介绍，“灵晟”定位为面向科学工程智能计算的国产全栈融合基础设施：

在芯片层面，自研LX2 CPU创新性引入多精度与矩阵加速能力，实现了片上超算算力与智能算力的深度融合，并集成了首颗国产HBM，内存带宽较传统CPU提升10倍；在网络层面，自主设计的灵启高速互连网络支持200万个端口、10万节点的超大规模组网；在存储层面，采用分层架构设计，兼顾高性能作业区与容量型数据区，可扩展至E级存储容量；在系统层面，构建了大规模超智融合框架，自研全栈软件，将底层硬件能力以可用、可编程、可优化的方式释放给应用，显著提升了各领域应用的性能；在节能方面，首创100%全液冷散热计算机柜，以51GFlops/W的能效比，在保持世界第一持续性能的同时，树立了绿色计算的新标杆。

全球超算算力排名解析

超级计算机作为具备极高计算速度和强大并行处理能力的计算系统，广泛应用于科学研究、气候模拟、药物研发、天体物理等领域，能够预测天气、模拟台风路径、研发新药、筛选抗癌分子等。其强大的计算能力为人类探索未知世界提供了重要工具。

回顾历史，中国超算上一次登顶TOP500榜单是在2017年。当时，“神威·太湖之光”安装于国家超级计算无锡中心，以93 Petaflop/s的Linpack成绩位居榜首，并保持了两年半的领先地位，直至2018年春季美国橡树岭国家实验室的IBM Summit系统问世。“神威·太湖之光”采用中国自主设计的“申威”系列芯片，是全球首台运行速度超过10亿亿次/秒的超级计算机，峰值性能高达12.5亿亿次/秒，持续性能达到9.3亿亿次/秒。然而，2019年美国政府对华实施制裁，限制中国获取最先进的芯片技术，此后中国停止了向TOP500提交Linpack测试结果。尽管中国仍在持续建设超算，但在近九年的时间里，TOP500榜首一直由美国和欧洲的系统占据。

如今，“灵晟”的登顶打破了这一局面，重新确立了中国在全球超算领域的领先地位。

“灵晟”超算系统总设计师、国家超算深圳中心主任卢宇彤教授

在本次TOP500榜单中，“灵晟”登顶后，其他超算的排名均顺延一位。劳伦斯·利弗莫尔国家实验室的El Capitan以1.809 Exaflop/s位列第二，橡树岭国家实验室的Frontier以1.353 Exaflop/s排名第三，阿贡国家实验室的Aurora以1.012 Exaflop/s位列第四，德国于利希超级计算中心的JUPITER Booster以1.000 Exaflop/s排名第五。前十名中还出现了一张新面孔——意大利能源公司埃尼集团的HPC7以571.5 Petaflop/s首次亮相便跻身第六。微软Azure云平台的Eagle系统降至第七，意大利埃尼的HPC6位列第八，日本的Fugaku以442 Petaflop/s排名第九，瑞士的Alps以434.9 Petaflop/s排名第十。

TOP500在新闻稿中指出，超级计算领域的高端架构正呈现出显著的多样性。从全中国自主研发的全CPU架构的“灵晟”，到配备AMD加速器的HPE Cray集群（如El Capitan和Frontier），再到采用英伟达Grace Hopper架构的JUPITER Booster和Alps，乃至搭载英特尔Ponte Vecchio GPU的Aurora系统，没有哪一种架构占据绝对主导地位。微软的Eagle集群结合了Intel Xeon处理器和Nvidia H100加速器，而日本的Fugaku则基于富士通的A64FX Arm处理器构建。“这份榜单表明，通往领先级计算领域并没有单一的主导技术路径。相反，厂商们正在探索各种CPU、GPU、APU和定制加速器方案，并结合不同的互连和系统设计。”

“灵晟”的登顶，不仅是性能的突破，更是技术路线的成功验证。在AMD与英伟达GPU对华出口禁令持续生效的背景下，中国超算选择了一条不依赖外部GPU的全CPU路径，并在全球最权威的性能榜单上证明了这条路径的可行性。这背后是芯片、互连、存储、系统软件、散热等各个环节的全面自主突破。“灵晟”的价值最终体现在应用上——在大规模并行环境下平均扩展效率达到84.4%，实现了超过千万核心的全系统高效可扩展运行。从2017年“神威·太湖之光”的93 Petaflop/s到2026年“灵晟”的2.198 Exaflop/s，中国超算在近九年的时间里完成了超过23倍的性能跃升，重新定义了全球超算的算力天花板。

本文为徽声在线独家稿件，未经授权，不得转载。

点击展开全文