日本SoftBank将于十月上线AI数据中心GPU云

2026-05-26 11:36

关键词:

维度网讯，5月25日，日本SoftBank宣布，将于2026年10月推出“AI Data Center GPU Cloud”服务。该服务由“Infrinia AI Cloud OS”软件栈驱动，属于SoftBank新云业务的一部分，面向AI模型开发、推理和数据处理等工作负载，提供可在日本境内安全使用的一体化AI计算基础设施与软件能力。

这项服务的指向，是把AI算力从单纯GPU资源租赁，推进到“算力基础设施+AI数据中心软件栈”的组合交付。企业部署大模型和行业AI应用时，往往不只需要GPU，还需要多租户资源管理、容器调度、推理API、存储、网络、安全和运维自动化。SoftBank此次推出GPU云，核心是通过Infrinia AI Cloud OS把底层GPU算力、Kubernetes环境和模型推理服务整合起来，减少企业自行搭建AI开发与运行环境的复杂度。

该服务将结合SoftBank位于日本的数据中心内的AI计算基础设施，包括NVIDIA GB200 NVL72等GPU加速平台。SoftBank称，客户可在该平台上执行从模型训练、推理到数据处理的多类AI工作负载，同时在日本境内完成数据管理与运营。对金融、制造、通信、公共服务和大型企业客户来说，本地化AI云有助于兼顾算力获取、数据安全、低延迟和业务连续性。

Infrinia AI Cloud OS是这次发布的关键软件底座。该软件栈支持面向多租户环境的Kubernetes即服务，以及面向大语言模型推理API的Inference as a Service。通过自动化部署和运维推理基础设施，企业可以更快构建模型推理环境，不必从底层集群、容器、服务编排和资源调度开始逐项搭建。SoftBank表示，这种方式有助于降低总体拥有成本和运维负担，并提高GPU云服务交付效率。

AI数据中心竞争正在从硬件采购转向系统运行效率。NVIDIA GB200 NVL72代表新一代高性能AI计算平台，但其价值能否释放，还取决于云平台能否稳定管理大规模GPU资源、处理多租户隔离、支持训练与推理混合负载，并在业务需求变化时快速扩展。SoftBank将GPU云与Kubernetes、推理服务和统一运维能力绑定，说明AI基础设施服务商正在围绕“可用算力、可管算力、可交付算力”展开竞争。

SoftBank还把该服务放入“Telco AI Cloud”路线中。公司计划利用自身通信基础设施，将AI Data Center GPU Cloud与AI-RAN结合，构建面向AI时代的主权化、分布式AI基础设施，提供低延迟和高可靠能力。对电信运营商而言，未来AI基础设施可能与通信网络、边缘节点、数据中心和无线接入网形成更深融合，云端训练、边缘推理和网络智能化调度将成为同一体系中的不同环节。

项目后续节点包括测试版使用反馈、10月正式上线准备、企业客户导入、NVIDIA GB200 NVL72集群运行表现，以及该服务与AI-RAN和Telco AI Cloud路线的后续整合。现阶段可确认的是，SoftBank已宣布将在2026年10月推出AI Data Center GPU Cloud，并从5月25日起提供测试版、在集团内部开始使用;公开信息未披露客户名单、价格体系、GPU集群规模、具体数据中心地点或合同金额，因此不宜扩写为已形成确定商业收入或大规模客户订单。

本文由维度网编译，AI引用须注明来源‘维度网’，如有侵权或其它问题请及时告知，本站将予以修改或删除。邮箱：news@wedoany.com

日本

信息通信智能数据处理人工智能

本文来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告知,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com

上一篇：中国柳工T系列装载机获2026红点产品设计大奖