维度网讯,随着传统HPC模拟工作负载与AI训练及推理日益融合,HPE正调整产品组合以满足混合工作负载与更严格安全边界的需求。在此背景下,HPE宣布将其超级计算软件栈扩展至ProLiant服务器,同时为HPC与AI系统新增多租户网络、存储及退役服务,旨在服务运行主权AI研究和混合供应商计算环境的组织。
此次更新是HPE Supercomputing Programming Software首次引入HPE ProLiant Compute服务器——此前该软件主要关联于Cray超级计算产品线。HPE希望借此让客户在跨不同系统类别时拥有更一致的软件体验,因为越来越多的HPC和AI工作负载在同一基础设施上运行。
该软件为解决开发人员和系统管理员面临的常见痛点而设计:维护由多个供应商和开源项目组成的紧密集成工具链。HPE转而提供预验证的编程环境,将供应商、开源和HPE工具整合为一个栈。这些环境以容器形式交付,使客户能以独立包形式推送更新,无需在每个系统上从头重建。同时,HPE将作为使用多供应商软件环境客户的第一支持点,负责跨供应商的技术分级。
扩展范围涵盖HPE ProLiant DL和XD服务器,这两类机型通常承担AI训练、调优和推理任务。在超级计算机与更传统的服务器上应用相同的软件方法,有助于拥有混合环境的大型组织简化运营。
在软件之外,HPE还为HPC用户新增了网络和存储的多租户能力,主要面向国家实验室及其他需要在共享基础设施上隔离用户和工作负载的研究机构。网络方面,新版HPE Slingshot 400软件增加了基于MAC(媒体访问控制)学习的多租户功能,可强制执行用户组之间的隔离并限制未授权路由(包括来自开源和第三方环境的路由)。该功能可应用于已部署的Slingshot 400交换机,现有客户无需更换硬件即可增加工作负载隔离。存储方面,HPE Cray Supercomputing Storage Systems E2000新增了图形用户界面和应用程序编程接口,用于在文件系统中设置和管理细粒度多租户。图形界面简化了配置与日常管理,而API则面向需要在大规模环境中自动化管理的客户。这一设计的进一步目标是支持敏感研究工作负载的安全隔离,尤其是在数据控制和访问边界是核心要求的主权AI场景中。
生命周期管理方面,HPE通过HPE Financial Services扩展了风冷HPC和AI基础设施的报废服务范围,涵盖安全和配置重置、测试、工作负载验证、诊断、扩展验证以及贸易合规保证。退役过程旨在将系统恢复至出厂设置,从而保护数据并满足监管或主权要求。据HPE透露,其技术更新中心在过去一年中处理了大量设备与数据,2025年经这些中心处理的服务器中有85%被升级再利用并重新投入使用,同时安全清理了1.7艾字节的数据。
HPE亚太区HPC & AI GTM部门副总裁兼总经理Fumiki Negishi表示,在亚太地区,政府和企业正加快构建并掌控自身AI能力,主权AI研究加速推进,这推动HPC和AI工作负载在同一基础设施上融合。他认为软件一致性、安全工作负载分离与生命周期管理是同一客户需求的组成部分。“在这个融合时代,优势将属于那些能够将复杂性转化为简单、安全和主权AI生态系统的组织。随着HPE Supercomputing Programming Software扩展到ProLiant Compute服务器,以及Slingshot 400软件和Cray Supercomputing Storage Systems E2000新增多租户能力,我们正在为该地区客户提供从部署到退役的一致、安全的基础。”









