中国中科曙光发布10T级CPU通用高性能计算平台
2026-06-16 08:51
收藏

维度网讯,6月15日,中科曙光发布新一代通用高性能计算平台。该平台搭载首个国产10T级通用CPU,采用128核、512线程设计,单CPU FP64双精度算力达到10T。平台在HPL双精度浮点相对性能上较上一代提升近2倍,STREAM访存性能提升近1倍,应用性能平均提升近1倍,整体规格首次达到国际厂商旗舰级水平。此次发布面向科学计算、工业仿真、工程设计、气象海洋、能源勘探和AI for Science等高精度计算场景,显示中国通用高性能计算平台在CPU算力、内存访问和应用适配层面进入新的工程阶段。

通用高性能计算平台的核心价值,在于它并不只服务单一AI训练任务,而是支撑大量依赖双精度浮点计算和高内存带宽的科学工程应用。HPL主要用于衡量系统在高精度浮点计算中的峰值能力,STREAM则反映内存带宽和访存效率。对气候模拟、流体力学、结构仿真、材料计算、药物筛选、油气勘探和复杂工业设计来说,CPU的双精度性能、访存能力和软件生态兼容性,直接影响任务能否稳定运行、计算周期能否缩短,以及既有科研和工业软件能否低成本迁移。

此次平台搭载的国产10T级通用CPU,把单颗CPU FP64双精度算力提升到10T级别,并采用百核级多线程架构。与只强调加速卡或专用芯片的算力路线不同,通用CPU平台更强调生态兼容、任务调度、复杂分支处理和大规模工程软件运行能力。公开信息还显示,该平台为首个兼容AVX-512指令集的国产通用计算平台,并原生兼容x86生态,可降低相关领域软件应用和生态迁移成本。 这意味着用户在迁移高性能计算应用时,不必完全重构软件环境,也更容易延续既有算法库、编译器和工程应用流程。

从系统工程角度看,这次升级并不是单纯替换一颗CPU,而是围绕“算、存、网”进行平台级协同优化。高性能计算任务往往需要大量节点并行运行,瓶颈可能出现在处理器、内存、互连网络、存储I/O或散热系统任何一处。若单颗CPU算力提升,但访存、互连和散热无法跟上,实际应用性能仍难以释放。中科曙光此次强调HPL、STREAM和应用性能同步提升,说明平台优化已经覆盖计算核心、内存访问、系统互连和应用软件适配等多个环节,这也是通用高性能计算平台从芯片参数走向真实工程可用性的关键。

散热形态也反映了平台面向不同规模算力中心的部署需求。科创板日报披露,该平台提供风冷、冷板液冷、浸没液冷三种散热形态的计算节点,可适配不同规模算力中心建设。 对高密度算力系统而言,散热能力会直接限制机柜功率和持续运行稳定性。风冷适合部分传统机房和中低密度部署,冷板液冷和浸没液冷则更适合高密度、高能效和大规模集群环境。随着科学计算和AI计算负载同时增长,算力中心需要在性能、能耗、空间和运维复杂度之间重新平衡,平台级散热方案将成为国产高性能计算系统规模化部署的重要支撑。

这次发布也说明CPU在高性能计算和AI基础设施中的价值正在被重新认识。GPU和AI加速器在大模型训练和推理中占据核心位置,但大量科学计算、工业仿真和系统级调度仍依赖高性能通用CPU。尤其在AI for Science场景中,传统数值模拟、数据预处理、模型训练、结果分析和工程验证往往混合运行,CPU、加速器、内存和高速互连需要形成统一平台能力。中科曙光新一代通用高性能计算平台如果能够在应用迁移、生态兼容和集群部署中持续验证,将有助于提升中国在高端计算基础设施中的自主供给能力。

后续仍要观察平台在真实用户场景中的落地表现。实验室性能指标和发布会参数只是起点,科学计算中心、工业仿真平台、能源企业、科研机构和智算中心更关注的是长时间稳定运行、软件兼容、集群扩展、能耗表现、交付周期和运维成本。若该平台能够在复杂应用中保持双精度计算、访存和应用性能提升,并支持不同散热形态下的大规模部署,它将为中国高性能计算基础设施提供新的通用算力底座,也为科学研究、先进制造和数字工程应用提供更强的本地化计算支撑。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com