中国华为云发布智能体基础设施堆栈,支持10万卡集群
2026-06-16 14:45
收藏

维度网讯,华为云发布“Agentic Infra”(智能体基础设施)堆栈,提供一套完整的计算、存储和网络产品组合,旨在基于NPU的云平台上支持大规模AI智能体运行。此举被视为该云服务商迄今最直接地与英伟达在AI基础设施领域展开竞争的举措。

华为印尼雅加达新办公室

在上海举行的Inspire活动上,华为云推出AICS(AI集群服务),称其可支持包含10万张卡集群的计算平台。该集群基于华为自研的UnifiedBus(UB)互连协议运行,在1000张卡间提供每秒500万个token的吞吐量,总计计算能力达200 EFLOPS(每秒百亿亿次浮点运算),token生成延迟低于10毫秒。

华为同步发布名为AMS(Agentic Memory Storage)的存储解决方案,为NPU芯片提供内存扩展,并通过分层键值(KV)缓存降低长周期智能体任务的推理成本。

堆栈其他组件包括CCE Volcano Next调度器,通过合并训练和推理工作负载而非隔离,声称资源利用率提高30%以上;以及AgentSphere,一个安全隔离的沙箱环境,用户可每分钟启动数十万个智能体实例。

该堆栈在华为董事会董事、华为云CEO Peter Zhou博士的主题演讲中亮相。他表示,智能体AI正推动计算范式的根本性转变。华为在Inspire上展示基础设施堆栈之际,正值中国推动构建国产替代品,该巨头正利用美国芯片进口禁令后的市场机会,加倍投入计算能力。尽管华为CEO任正非去年夏天承认其芯片比美国同行落后一代,但公司正寻求迅速缩小差距。其半导体设计的缩放原则Tau(τ)专注于通过减少芯片信号传播延迟来改进设计,而非进一步缩小晶体管。华为已利用该概念设计约381款芯片,并将与LogicFolding架构相结合,后者已在多个层面提升τ性能,对麒麟处理器系列开发至关重要。

在模型与智能体领域,华为发布ModelArts Next模型平台,新增强化学习即服务(RLaaS)和模型路由层,可动态将请求发送给20多个合作伙伴模型中最适合的任务,包括DeepSeek、Zhipu AI和MiniMax的系统。华为称该路由引擎的调度准确率超过95%,推理成本降低约20%。合作伙伴名单正式化为“AI模型合作伙伴计划”。华为还发布AgentArts企业智能体平台,面向生产级、长周期智能体任务,提供开源版本,其代码库与商业版共享超过90%,以及AgentArts Orchard门户用于通过命令行界面构建和部署智能体。

华为为该堆栈推出专用安全层,包括自持密钥(HYOK)硬件加密和跨虚拟机、训练及推理的机密计算支持,并宣称已超过1000天无重大服务事件。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com