美国AI云平台GMI Cloud支持Vera Rubin代理型AI工厂建设

2026-06-05 10:16

关键词:

维度网讯，近日，美国AI原生云基础设施公司GMI Cloud宣布，其平台将支持面向代理型AI工厂的新一代基础设施建设，并与英伟达在GTC 2026台北期间推进的Vera Rubin平台方向保持一致。该公司正在构建以推理为核心的云平台，面向开发者和企业提供生产级AI工作负载的部署、扩展和运行能力。

GMI Cloud此次强调的“代理型AI工厂”，指向AI应用从单次问答走向长期运行、自主协作和多模态处理之后，对底层基础设施提出的新要求。传统AI云资源更多围绕模型训练、单模型推理或API调用展开;当AI代理开始执行规划、调用工具、处理图像视频音频、保留上下文记忆并持续运行时，平台需要同时支撑高吞吐低延迟推理、动态扩缩容、多租户隔离、长期上下文管理、工作流编排和安全执行环境。GMI Cloud的平台组合包括训练、推理和生产部署基础设施，Prime Inference低延迟模型服务，面向专有模型和开源模型的MaaS API，企业级专用端点，以及用于可扩展AI运营的基础设施编排与优化层。

代理式工作流基础设施是此次发布的关键部分。GMI Cloud提出的平台能力覆盖沙箱化、工具调用型、自主AI系统，并支持面向下一代AI应用的多模态原生部署环境。对企业客户来说，这类能力可用于构建持续运行的客服代理、代码代理、数据分析代理、内容生成系统、工业流程助手和业务自动化工作流。与普通模型调用相比，代理型AI系统需要在更长时间内保持状态、访问工具、读写外部数据，并在多个任务之间调度资源，因此底层云平台的稳定性、隔离性和成本可控性会直接影响生产部署质量。

安全也被放在AI工厂基础设施的核心位置。GMI Cloud表示，其正在采用英伟达机密计算能力，为需要保护模型和数据隐私的新一代AI工作负载提供可信执行环境。随着AI工厂处理企业专有数据、受监管内容、模型上下文和代理记忆，推理平台必须同时满足性能、隐私、安全和合规需求。Vera Rubin平台则被视为AI工厂基础设施演进的重要节点，围绕下一代计算、网络、安全和机架级系统设计，服务代理型AI对大规模推理和连续运行的需求。

这项发布反映出AI云基础设施竞争正在从“提供GPU算力”转向“支撑生产级智能系统”。AI应用进入企业核心流程后，客户关注的不只是能否租到GPU，还包括模型服务延迟、token成本、平台可用性、安全隔离、工作流编排、专用端点、模型接入范围和多模态任务承载能力。GMI Cloud选择围绕推理原生架构和代理型AI工厂定位，说明其希望在AI基础设施链条中承担更接近生产运行层的角色。后续关键变量在于，GMI Cloud能否把Vera Rubin相关生态、机密计算能力和推理平台组合成可规模化交付的产品，并吸引更多开发者、初创公司和企业客户把复杂AI代理部署到其云平台之上。

本文由维度网编译，AI引用须注明来源‘维度网’，如有侵权或其它问题请及时告知，本站将予以修改或删除。邮箱：news@wedoany.com

美国