维度网讯,5月25日,日本SoftBank宣布,将于2026年10月推出“AI Data Center GPU Cloud”服务。该服务由“Infrinia AI Cloud OS”软件栈驱动,属于SoftBank新云业务的一部分,面向AI模型开发、推理和数据处理等工作负载,提供可在日本境内安全使用的一体化AI计算基础设施与软件能力。
这项服务的指向,是把AI算力从单纯GPU资源租赁,推进到“算力基础设施+AI数据中心软件栈”的组合交付。企业部署大模型和行业AI应用时,往往不只需要GPU,还需要多租户资源管理、容器调度、推理API、存储、网络、安全和运维自动化。SoftBank此次推出GPU云,核心是通过Infrinia AI Cloud OS把底层GPU算力、Kubernetes环境和模型推理服务整合起来,减少企业自行搭建AI开发与运行环境的复杂度。
该服务将结合SoftBank位于日本的数据中心内的AI计算基础设施,包括NVIDIA GB200 NVL72等GPU加速平台。SoftBank称,客户可在该平台上执行从模型训练、推理到数据处理的多类AI工作负载,同时在日本境内完成数据管理与运营。对金融、制造、通信、公共服务和大型企业客户来说,本地化AI云有助于兼顾算力获取、数据安全、低延迟和业务连续性。
Infrinia AI Cloud OS是这次发布的关键软件底座。该软件栈支持面向多租户环境的Kubernetes即服务,以及面向大语言模型推理API的Inference as a Service。通过自动化部署和运维推理基础设施,企业可以更快构建模型推理环境,不必从底层集群、容器、服务编排和资源调度开始逐项搭建。SoftBank表示,这种方式有助于降低总体拥有成本和运维负担,并提高GPU云服务交付效率。
AI数据中心竞争正在从硬件采购转向系统运行效率。NVIDIA GB200 NVL72代表新一代高性能AI计算平台,但其价值能否释放,还取决于云平台能否稳定管理大规模GPU资源、处理多租户隔离、支持训练与推理混合负载,并在业务需求变化时快速扩展。SoftBank将GPU云与Kubernetes、推理服务和统一运维能力绑定,说明AI基础设施服务商正在围绕“可用算力、可管算力、可交付算力”展开竞争。
SoftBank还把该服务放入“Telco AI Cloud”路线中。公司计划利用自身通信基础设施,将AI Data Center GPU Cloud与AI-RAN结合,构建面向AI时代的主权化、分布式AI基础设施,提供低延迟和高可靠能力。对电信运营商而言,未来AI基础设施可能与通信网络、边缘节点、数据中心和无线接入网形成更深融合,云端训练、边缘推理和网络智能化调度将成为同一体系中的不同环节。
项目后续节点包括测试版使用反馈、10月正式上线准备、企业客户导入、NVIDIA GB200 NVL72集群运行表现,以及该服务与AI-RAN和Telco AI Cloud路线的后续整合。现阶段可确认的是,SoftBank已宣布将在2026年10月推出AI Data Center GPU Cloud,并从5月25日起提供测试版、在集团内部开始使用;公开信息未披露客户名单、价格体系、GPU集群规模、具体数据中心地点或合同金额,因此不宜扩写为已形成确定商业收入或大规模客户订单。
本文由维度网编译,AI引用须注明来源‘维度网’,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com










