软银将于2026年10月在日本推出AI数据中心GPU云服务

2026-05-27 14:21

关键词:

维度网讯，软银公司（SoftBank Corp.）宣布，将于2026年10月推出AI数据中心GPU云服务，这是其新增长战略“激活AI造福社会”（Activate AI for Society）的一部分，该服务由Infrinia AI Cloud OS驱动，作为其Neocloud业务的重要组成部分。

软银推出由Infrinia AI Cloud OS驱动的AI数据中心GPU云，面向日本Neocloud市场

这项AI数据中心GPU云服务将提供可在日本境内安全使用的集成AI计算基础设施和软件。在正式发布前，软银计划推出beta版本，并在集团内部启动该服务的试用。该服务结合了软银的AI计算基础设施与Infrinia AI Cloud OS，后者是一个面向AI数据中心的软件栈，为多租户环境提供Kubernetes即服务（Kubernetes as a Service），并为大型语言模型推理提供通过API的推理即服务（Inference as a Service）。

通过利用部署在软银日本数据中心的英伟达（NVIDIA）GB200 NVL72等先进GPU加速计算基础设施，客户能够高效、灵活地执行从模型训练、推理到数据处理的各种AI工作负载，同时确保在日本境内的安全数据管理和运营。该服务提供GPU资源的集中化自动管理、基于Kubernetes的运维以及AI工作负载的执行，实现对每个工作负载的优化处理，从而减少搭建开发环境和管理计算资源的工作量，降低运营负担和成本，提供一个稳定且能灵活适应变化的平台。

该服务支持从计算密集型训练（如LLM开发）到延迟敏感型推理的广泛AI工作负载，基于包括NVIDIA GB200 NVL72在内的先进加速计算平台，通过NVIDIA NVLink互连高性能NVIDIA Blackwell GPU与高性能存储相结合，在多租户环境中也能实现高效的LLM训练和复杂的推理处理。Kubernetes即服务功能可集中化和自动化管理大规模容器环境，降低运营复杂性，基于Kubernetes的负载均衡确保服务稳定交付，故障时的自动恢复机制则提供高可用性和服务连续性。容器技术还能加速应用程序启动，简化部署和扩展。推理即服务功能通过自动化Kubernetes上模型推理基础设施的部署和运营，支持推理API的快速开发，使用户能够快速可靠地部署推理环境。

软银公司（SoftBank Corp.）总裁兼CEO Junichi Miyakawa（宫川纯一）表示，随着AI与社会深度融合，竞争力的来源已从AI本身扩展到支撑AI的计算能力和运营软件，软银将作为Neocloud提供商，提供可在日本境内安全使用的集成计算基础设施和软件。NVIDIA DGX系统副总裁Charlie Boyle（查理·博伊尔）评论称，软银部署NVIDIA GB200 NVL72和Infrinia AI Cloud OS，为日本企业提供了一个高性能、安全且可扩展的平台，以加速其行业发展。

展望未来，基于其“电信AI云”（Telco AI Cloud）计划，即通过利用其电信基础为AI时代构建下一代社会基础设施，软银旨在通过将AI数据中心GPU云与AI-RAN集成，优化从训练到推理的AI处理，同时构建一个主权、分布式、低延迟、高可靠性的AI基础设施。

本文由维度网编译，AI引用须注明来源“维度网”，如有侵权或其它问题请及时告知，本站将予以修改或删除。邮箱：news@wedoany.com

日本

信息通信智能数据处理人工智能

本文来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告知,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com

上一篇：加拿大卡尼管道项目或最快2027年开建

下一篇：美国D-Wave获540万美元资助超导量子比特制造研究