美国AI云平台GMI Cloud支持Vera Rubin代理型AI工厂建设
2026-06-05 10:16
收藏

维度网讯,近日,美国AI原生云基础设施公司GMI Cloud宣布,其平台将支持面向代理型AI工厂的新一代基础设施建设,并与英伟达在GTC 2026台北期间推进的Vera Rubin平台方向保持一致。该公司正在构建以推理为核心的云平台,面向开发者和企业提供生产级AI工作负载的部署、扩展和运行能力。

GMI Cloud此次强调的“代理型AI工厂”,指向AI应用从单次问答走向长期运行、自主协作和多模态处理之后,对底层基础设施提出的新要求。传统AI云资源更多围绕模型训练、单模型推理或API调用展开;当AI代理开始执行规划、调用工具、处理图像视频音频、保留上下文记忆并持续运行时,平台需要同时支撑高吞吐低延迟推理、动态扩缩容、多租户隔离、长期上下文管理、工作流编排和安全执行环境。GMI Cloud的平台组合包括训练、推理和生产部署基础设施,Prime Inference低延迟模型服务,面向专有模型和开源模型的MaaS API,企业级专用端点,以及用于可扩展AI运营的基础设施编排与优化层。

代理式工作流基础设施是此次发布的关键部分。GMI Cloud提出的平台能力覆盖沙箱化、工具调用型、自主AI系统,并支持面向下一代AI应用的多模态原生部署环境。对企业客户来说,这类能力可用于构建持续运行的客服代理、代码代理、数据分析代理、内容生成系统、工业流程助手和业务自动化工作流。与普通模型调用相比,代理型AI系统需要在更长时间内保持状态、访问工具、读写外部数据,并在多个任务之间调度资源,因此底层云平台的稳定性、隔离性和成本可控性会直接影响生产部署质量。

安全也被放在AI工厂基础设施的核心位置。GMI Cloud表示,其正在采用英伟达机密计算能力,为需要保护模型和数据隐私的新一代AI工作负载提供可信执行环境。随着AI工厂处理企业专有数据、受监管内容、模型上下文和代理记忆,推理平台必须同时满足性能、隐私、安全和合规需求。Vera Rubin平台则被视为AI工厂基础设施演进的重要节点,围绕下一代计算、网络、安全和机架级系统设计,服务代理型AI对大规模推理和连续运行的需求。

这项发布反映出AI云基础设施竞争正在从“提供GPU算力”转向“支撑生产级智能系统”。AI应用进入企业核心流程后,客户关注的不只是能否租到GPU,还包括模型服务延迟、token成本、平台可用性、安全隔离、工作流编排、专用端点、模型接入范围和多模态任务承载能力。GMI Cloud选择围绕推理原生架构和代理型AI工厂定位,说明其希望在AI基础设施链条中承担更接近生产运行层的角色。后续关键变量在于,GMI Cloud能否把Vera Rubin相关生态、机密计算能力和推理平台组合成可规模化交付的产品,并吸引更多开发者、初创公司和企业客户把复杂AI代理部署到其云平台之上。

本文由维度网编译,AI引用须注明来源‘维度网’,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com