维度网讯,谷歌DeepMind(Google DeepMind)正式发布Interactions API,推动Gemini从模型调用转向智能体执行。该API能够在统一端点(Unified Endpoint)上同时处理Gemini模型调用和智能体执行,开发者只需将模型ID传递给推理任务,将智能体ID传递给自主任务即可。
此前,开发者发送提示(Prompt)后,API仅调用模型并返回答案。而Interactions API的关键变化在于,API的角色从单纯的模型调用扩展到了智能体任务执行管理,能够在一个流程中支持智能体执行、任务状态管理、工具连接及后台处理等功能。

托管智能体(Managed Agent)功能可帮助开发者通过单次API调用创建远程Linux沙盒(Sandbox)。Gemini智能体可在该沙盒中进行推理、执行代码、浏览网页和管理文件。

VentureBeat认为,Interactions API是一个统一接口,设计上使大语言模型(LLM)不再仅是文本生成器,而更接近远程操作系统。这意味着模型正从仅生成答案的工具,转变为能够调用多个模型、执行重复调用、使用工具甚至运行后端代码的系统。
在成本方面,Interactions API将对话记录和任务内容存储在谷歌服务器上,开发者无需每次重新发送相同的长上下文。在频繁使用大规模文档或长对话记录的智能体服务中,此举可降低令牌成本和响应延迟。免费版客户的任务记录保留一天,付费用户可保留55天。TechCrunch指出,这有利于保持API状态并降低价格,但处理敏感数据的企业需同时考量数据治理和数据驻留问题。
谷歌DeepMind集团产品经理阿里·切比克(Ali Chebik)在官网上强调,Interactions API基于开发者反馈开发,正式发布后这一方向也不会改变。









