美国谷歌DeepMind发布Interactions API

2026-06-30 11:47

关键词:

维度网讯，谷歌DeepMind（Google DeepMind）正式发布Interactions API，推动Gemini从模型调用转向智能体执行。该API能够在统一端点（Unified Endpoint）上同时处理Gemini模型调用和智能体执行，开发者只需将模型ID传递给推理任务，将智能体ID传递给自主任务即可。

此前，开发者发送提示（Prompt）后，API仅调用模型并返回答案。而Interactions API的关键变化在于，API的角色从单纯的模型调用扩展到了智能体任务执行管理，能够在一个流程中支持智能体执行、任务状态管理、工具连接及后台处理等功能。

德米斯·哈萨比斯（Demis Hassabis），谷歌DeepMind联合创始人兼首席执行官（CEO）。（照片=谷歌DeepMind）

托管智能体（Managed Agent）功能可帮助开发者通过单次API调用创建远程Linux沙盒（Sandbox）。Gemini智能体可在该沙盒中进行推理、执行代码、浏览网页和管理文件。

Interactions API能在统一端点上同时处理Gemini模型调用和智能体执行。（照片=谷歌DeepMind官网）

VentureBeat认为，Interactions API是一个统一接口，设计上使大语言模型（LLM）不再仅是文本生成器，而更接近远程操作系统。这意味着模型正从仅生成答案的工具，转变为能够调用多个模型、执行重复调用、使用工具甚至运行后端代码的系统。

在成本方面，Interactions API将对话记录和任务内容存储在谷歌服务器上，开发者无需每次重新发送相同的长上下文。在频繁使用大规模文档或长对话记录的智能体服务中，此举可降低令牌成本和响应延迟。免费版客户的任务记录保留一天，付费用户可保留55天。TechCrunch指出，这有利于保持API状态并降低价格，但处理敏感数据的企业需同时考量数据治理和数据驻留问题。

谷歌DeepMind集团产品经理阿里·切比克（Ali Chebik）在官网上强调，Interactions API基于开发者反馈开发，正式发布后这一方向也不会改变。

美国