中国华为云发布智能体基础设施堆栈，支持10万卡集群

2026-06-16 14:45

关键词:

维度网讯，华为云发布“Agentic Infra”（智能体基础设施）堆栈，提供一套完整的计算、存储和网络产品组合，旨在基于NPU的云平台上支持大规模AI智能体运行。此举被视为该云服务商迄今最直接地与英伟达在AI基础设施领域展开竞争的举措。

华为印尼雅加达新办公室

在上海举行的Inspire活动上，华为云推出AICS（AI集群服务），称其可支持包含10万张卡集群的计算平台。该集群基于华为自研的UnifiedBus（UB）互连协议运行，在1000张卡间提供每秒500万个token的吞吐量，总计计算能力达200 EFLOPS（每秒百亿亿次浮点运算），token生成延迟低于10毫秒。

华为同步发布名为AMS（Agentic Memory Storage）的存储解决方案，为NPU芯片提供内存扩展，并通过分层键值（KV）缓存降低长周期智能体任务的推理成本。

堆栈其他组件包括CCE Volcano Next调度器，通过合并训练和推理工作负载而非隔离，声称资源利用率提高30%以上；以及AgentSphere，一个安全隔离的沙箱环境，用户可每分钟启动数十万个智能体实例。

该堆栈在华为董事会董事、华为云CEO Peter Zhou博士的主题演讲中亮相。他表示，智能体AI正推动计算范式的根本性转变。华为在Inspire上展示基础设施堆栈之际，正值中国推动构建国产替代品，该巨头正利用美国芯片进口禁令后的市场机会，加倍投入计算能力。尽管华为CEO任正非去年夏天承认其芯片比美国同行落后一代，但公司正寻求迅速缩小差距。其半导体设计的缩放原则Tau（τ）专注于通过减少芯片信号传播延迟来改进设计，而非进一步缩小晶体管。华为已利用该概念设计约381款芯片，并将与LogicFolding架构相结合，后者已在多个层面提升τ性能，对麒麟处理器系列开发至关重要。

在模型与智能体领域，华为发布ModelArts Next模型平台，新增强化学习即服务（RLaaS）和模型路由层，可动态将请求发送给20多个合作伙伴模型中最适合的任务，包括DeepSeek、Zhipu AI和MiniMax的系统。华为称该路由引擎的调度准确率超过95%，推理成本降低约20%。合作伙伴名单正式化为“AI模型合作伙伴计划”。华为还发布AgentArts企业智能体平台，面向生产级、长周期智能体任务，提供开源版本，其代码库与商业版共享超过90%，以及AgentArts Orchard门户用于通过命令行界面构建和部署智能体。

华为为该堆栈推出专用安全层，包括自持密钥（HYOK）硬件加密和跨虚拟机、训练及推理的机密计算支持，并宣称已超过1000天无重大服务事件。

本文由维度网编译，AI引用须注明来源“维度网”，如有侵权或其它问题请及时告知，本站将予以修改或删除。邮箱：news@wedoany.com

中国