美国ePlus推出私有AI基础设施服务,NVIDIA GPU集群托管交付
2026-05-28 17:09
收藏

维度网讯,5月26日,美国技术解决方案提供商ePlus宣布推出Private AI Infrastructure-as-a-Service,即私有AI基础设施即服务。该方案基于Digital Realty的PlatformDIGITAL和联想Hybrid AI Advantage平台构建,结合NVIDIA加速计算集群,为企业在安全托管数据中心内建设、部署和管理私有AI基础设施提供端到端服务。

该服务面向正在部署生成式AI、智能体AI和大模型工作负载的企业。许多机构需要高性能GPU资源,但自建AI基础设施通常涉及硬件采购、机房空间、电力供应、网络连接、集群部署、生命周期管理和持续优化等复杂环节。ePlus将这些环节封装为托管服务,试图帮助企业在保留私有基础设施控制权的同时,减少自行建设和运维GPU集群的压力。

根据ePlus发布信息,Private AI Infrastructure-as-a-Service由ePlus负责设计、实施和管理,服务内容包括认证工程师完成设计部署、7×24小时监控与支持、生命周期管理、补丁更新、优化,以及空间、电力和连接能力。客户仍拥有AI基础设施资产,从而在安全、控制权和长期投资价值方面获得更明确的边界。

NVIDIA平台是该方案的核心技术底座。ePlus表示,其同时具备NVIDIA DGX SuperPOD Specialization和DGX-Ready Managed Services Provider身份,可交付基于NVIDIA DGX BasePOD、DGX SuperPOD和NVIDIA AI Enterprise软件的全栈AI基础设施方案,用于加快AI开发和部署。ePlus方案页面还显示,该服务可提供2节点、4节点、8节点或16节点GPU集群配置,并支持NVIDIA H200和Blackwell GPU服务器、InfiniBand后端GPU互连、Spectrum以太网前端流量,以及基于Kubernetes的管理栈。

企业选择私有AI基础设施,通常与数据安全、模型控制、成本可预测性和合规要求有关。公有云GPU资源具备弹性优势,但对于长期、稳定、高密度AI训练或推理负载来说,成本和数据边界可能成为限制;完全自建机房又会带来电力、散热、运维和供应链压力。ePlus的方案把GPU集群放在安全托管设施中,并由服务商负责部署和管理,为企业提供介于公有云和完全自建之间的AI基础设施路径。

Digital Realty在该服务中提供托管设施和PlatformDIGITAL基础,联想Hybrid AI Advantage平台则参与硬件与系统方案支撑。对于需要快速上线AI工作负载的企业而言,预验证、生产就绪和可扩展集群是重要卖点。AI基础设施不是单纯采购GPU服务器,还需要高速网络、存储、调度、监控、模型运行环境和运维流程共同配合;其中任何一项短板,都可能影响模型训练、推理服务和智能体应用的稳定运行。

这类服务也反映出企业AI基础设施市场正在从“买GPU”转向“交付AI工厂能力”。随着智能体AI和生成式AI进入客服、研发、运营、风控、数据分析和内容生产等业务场景,企业需要更可靠的算力底座支撑持续运行。ePlus推出私有AI基础设施即服务,说明AI基础设施竞争正在从单一硬件供给,扩展到集群设计、托管运维、软件栈集成和生命周期管理。

后续观察重点将集中在ePlus该服务的客户采用情况、不同GPU集群规模的交付周期、NVIDIA H200与Blackwell平台的实际部署节奏、托管设施的电力和散热保障能力,以及企业是否能够通过私有AI基础设施降低长期AI工作负载成本。美国ePlus推出基于NVIDIA加速计算的私有AI基础设施即服务,为希望保持数据控制权、又不愿完全自建GPU集群的企业提供了新的部署选项。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com