美国亚马逊升级OpenSearch Serverless，面向AI代理突发检索流量

2026-05-29 14:18

关键词:

维度网讯，5月28日，亚马逊AWS宣布对Amazon OpenSearch Serverless进行新一代架构重构，推出默认采用的NextGen架构。新架构面向搜索、向量检索、混合搜索和智能体检索场景，支持最高20倍更快自动扩缩容、闲置时缩至零计算资源，并在与按峰值容量配置集群相比时，基础设施成本最高可降低60%。

此次升级的核心背景，是AI代理应用带来的搜索请求更加动态、突发和不可预测。AWS在发布信息中举例称，AI Agent可能在执行多步骤任务时触发数百个并发向量查询或检索步骤，随后又进入空闲状态。传统搜索基础设施通常需要提前做容量规划并按峰值负载配置资源，而新的OpenSearch Serverless架构通过计算与存储解耦，使系统能够在请求到来时快速增加OpenSearch Compute Unit，并在流量回落后释放计算资源。

OpenSearch Serverless原本就是Amazon OpenSearch Service的自动扩缩容部署选项，用于帮助企业构建全文搜索、日志分析、语义搜索和向量检索等应用。此次NextGen架构将计算层改为无状态设计，并让索引和搜索计算单元共同访问分布式共享存储层。由于数据不再绑定在本地计算节点上，新的计算资源可以在数秒内启动并处理请求，闲置资源也可以更快释放。

对智能体应用而言，检索基础设施已经成为核心组件。企业AI代理在回答问题、执行任务或生成决策建议时，往往需要调用向量数据库、企业知识库、产品目录、文档库和日志数据。一个代理任务可能拆分出多个搜索、排序、比对和补充检索步骤，流量并不像传统Web搜索那样稳定。Amazon OpenSearch Serverless此次强调“built from the ground up for agents”，正是围绕这类突发检索和短时高并发场景重构底层架构。

成本模型也是此次升级的重要变化。AWS表示，新的OpenSearch Serverless将索引、搜索、存储和向量索引GPU加速分别计量和计费;当10分钟内没有请求进入时，服务可释放计算资源，OCU使用量缩至零;当流量恢复时，容量约10秒内恢复，系统会在此期间排队处理进入请求，而不是直接丢弃。这对于有明显闲置周期的AI代理、研发测试、企业内部知识库和多租户SaaS应用，能够减少为偶发峰值长期保留资源的成本压力。

向量检索性能也被纳入新架构。对于NextGen架构下创建的向量集合，OpenSearch Serverless会在适当场景自动使用GPU支持的计算资源，加速HNSW向量索引构建。AWS称，这可显著缩短向量索引时间，并将GPU使用作为单独账单项展示。对需要快速导入文档、构建语义搜索和支持RAG应用的企业来说，向量索引构建速度会直接影响知识库更新效率和AI代理可用性。

AWS还简化了使用体验。新架构下，用户可以在数秒内创建集合并开始发送请求，不需要提前做容量规划，也不需要等待基础设施预热。控制台新增Express Create能力，用户只需提供集合名称和集合类型，即可快速创建集合;同时，新的区域级端点允许一个账户在同一区域通过单一主机名服务多个集合，减少多租户场景下连接池、TLS会话和端点管理复杂度。

不过，无服务器搜索并不意味着企业可以忽略架构治理。AI代理检索如果接入企业内部数据，仍需处理访问权限、索引更新、数据隔离、审计日志、查询成本、响应延迟和提示注入风险。尤其在RAG和Agent工作流中，搜索结果可能直接影响模型输出和后续工具调用，企业需要把检索质量、召回边界、数据分级和权限控制纳入统一设计。

后续观察重点将集中在OpenSearch Serverless NextGen在大规模向量检索、企业知识库、多租户SaaS和AI代理工作流中的实际性能表现，以及开发者是否会把其作为RAG和Agent系统的默认检索底座。美国亚马逊升级OpenSearch Serverless，说明云搜索基础设施正在从传统搜索和日志分析，转向为智能体突发检索流量、向量搜索和动态工作负载提供弹性支撑。

本文由维度网编译，AI引用须注明来源“维度网”，如有侵权或其它问题请及时告知，本站将予以修改或删除。邮箱：news@wedoany.com

美国