OpenAI近期发布Responses API,旨在支持开发者构建独立执行任务的AI代理,覆盖文件搜索、网页浏览与自动化操作,标志着AI代理技术迈向实用化。Responses API整合Chat Completions与Assistants API功能,支持GPT-4o及GPT-4o mini模型,具备实时网页搜索与信息引用能力,显著提升事实准确性。测试显示,GPT-4o搜索在SimpleQA基准中准确率达90%,GPT-4o mini达88%,远超GPT-4.5的63%。OpenAI承诺,Responses API将逐步取代Assistants API,计划于2026年上半年完成过渡。

新API提供文件搜索工具,快速检索企业数据库内容,且不用于模型训练,保护数据隐私。开发者可利用Computer-Using Agent(CUA)模型实现数据录入与浏览器操作自动化,但CUA在操作系统层面的任务执行尚不可靠,可能出现错误。OpenAI强调,Responses API为早期版本,将持续优化以提升稳定性与功能性。网页搜索工具虽提升准确性,仍存在10%的事实错误率,AI幻觉问题尚未完全解决。
同期发布的开源Agents SDK为开发者提供免费工具,支持模型与内部系统集成,包含安全防护与活动监控功能,优化单代理与多代理工作流。Agents SDK继承Swarm框架,简化复杂任务编排,已在Coinbase等企业中实现快速原型开发与部署。OpenAI首席执行官Sam Altman此前表示,2025年为AI代理“加入劳动力市场”的关键年份,Responses API与Agents SDK的推出为此目标奠定基础。行业仍需警惕AI代理技术的不成熟性,近期中国初创公司Butterfly Effect的Manus平台未能兑现承诺,凸显技术实用性与宣传之间的差距。









