美国Nutanix推出智能体网关控制平面 优化AI token开销
2026-07-03 11:12
收藏

维度网讯,Nutanix推出Agent Gateway(智能体网关)AI控制平面,旨在为企业提供集中管理模型使用和优化token成本的手段。该工具定位为应对当前员工可能使用前沿模型处理简单文档摘要等任务导致的“无序”token开销问题,为企业提供统一的视图以了解谁在使用什么以及如何控制token使用。

Nutanix logo

该网关部署在用户、应用程序以及日益增多的开放权重模型与前沿模型之间,允许企业针对不同工作负载和成本,制定关于谁可使用何种模型的策略。Nutanix CEO Rajiv Ramaswami(拉吉夫·拉马斯瓦米)将其控制平面定位为一种定义AI部署ROI的工具,以明确哪些团队可使用哪些工具和模型、用于哪些用例,以及允许其花费多少token。

Ramaswami在新闻发布会上表示,目前任何人都可以访问任何内容,而借助Agent Gateway,企业可以制定规则,让工程团队对一组用例使用“简单模型”,将最先进的系统留给最困难的多智能体应用。他指出,该AI网关概念在发布前已在高管层引起共鸣,在伦敦之行中参加的CIO和COO会议上,该想法受到广泛关注,且已成为CIO、COO乃至CFO等高管层关注的事项,Nutanix正推动合作伙伴迎头赶上以向客户传递这一信息。

Agent Gateway是Nutanix AI栈(Enterprise AI 2.7)的一部分,可将AI用户和智能体连接到模型以及兼容模型上下文协议(MCP)的工具和服务器,并强制执行基础设施运营商预设的策略和规则。Ramaswami承诺该平台将随时间迭代,并将其设想为“AI中的AI”,未来能变得更智能并理解应用程序本身,从而自行选择合适模型并优化成本。

目前,该网关面向Nutanix基于GPU的推理栈,该栈运行在Kubernetes上,并为混合的开放权重模型和前沿模型提供共享推理端点。该栈当前基于Nvidia,但Nutanix计划“在今年年底前”支持AMD,此举紧随AMD于二月向Nutanix投资1.5亿美元之后。Ramaswami表示,Nutanix最终希望与硬件无关,扩展对多种硬件平台的支持,提供推理栈及网关,以帮助企业以成本效益方式部署和使用AI,未来可能在Google TPU或AMD GPU上运行,提供一系列成本选项。

本文来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告之,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com