维度网讯,软银公司(SoftBank Corp.)宣布,将于2026年10月推出AI数据中心GPU云服务,这是其新增长战略“激活AI造福社会”(Activate AI for Society)的一部分,该服务由Infrinia AI Cloud OS驱动,作为其Neocloud业务的重要组成部分。

这项AI数据中心GPU云服务将提供可在日本境内安全使用的集成AI计算基础设施和软件。在正式发布前,软银计划推出beta版本,并在集团内部启动该服务的试用。该服务结合了软银的AI计算基础设施与Infrinia AI Cloud OS,后者是一个面向AI数据中心的软件栈,为多租户环境提供Kubernetes即服务(Kubernetes as a Service),并为大型语言模型推理提供通过API的推理即服务(Inference as a Service)。
通过利用部署在软银日本数据中心的英伟达(NVIDIA)GB200 NVL72等先进GPU加速计算基础设施,客户能够高效、灵活地执行从模型训练、推理到数据处理的各种AI工作负载,同时确保在日本境内的安全数据管理和运营。该服务提供GPU资源的集中化自动管理、基于Kubernetes的运维以及AI工作负载的执行,实现对每个工作负载的优化处理,从而减少搭建开发环境和管理计算资源的工作量,降低运营负担和成本,提供一个稳定且能灵活适应变化的平台。
该服务支持从计算密集型训练(如LLM开发)到延迟敏感型推理的广泛AI工作负载,基于包括NVIDIA GB200 NVL72在内的先进加速计算平台,通过NVIDIA NVLink互连高性能NVIDIA Blackwell GPU与高性能存储相结合,在多租户环境中也能实现高效的LLM训练和复杂的推理处理。Kubernetes即服务功能可集中化和自动化管理大规模容器环境,降低运营复杂性,基于Kubernetes的负载均衡确保服务稳定交付,故障时的自动恢复机制则提供高可用性和服务连续性。容器技术还能加速应用程序启动,简化部署和扩展。推理即服务功能通过自动化Kubernetes上模型推理基础设施的部署和运营,支持推理API的快速开发,使用户能够快速可靠地部署推理环境。
软银公司(SoftBank Corp.)总裁兼CEO Junichi Miyakawa(宫川纯一)表示,随着AI与社会深度融合,竞争力的来源已从AI本身扩展到支撑AI的计算能力和运营软件,软银将作为Neocloud提供商,提供可在日本境内安全使用的集成计算基础设施和软件。NVIDIA DGX系统副总裁Charlie Boyle(查理·博伊尔)评论称,软银部署NVIDIA GB200 NVL72和Infrinia AI Cloud OS,为日本企业提供了一个高性能、安全且可扩展的平台,以加速其行业发展。
展望未来,基于其“电信AI云”(Telco AI Cloud)计划,即通过利用其电信基础为AI时代构建下一代社会基础设施,软银旨在通过将AI数据中心GPU云与AI-RAN集成,优化从训练到推理的AI处理,同时构建一个主权、分布式、低延迟、高可靠性的AI基础设施。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com









