美国英伟达与AWS合作实现10倍向量索引提速

2026-06-26 09:51

关键词:

维度网讯，2026年6月25日，英伟达（NVIDIA）与亚马逊云服务（AWS）近期开展合作，旨在解决构建大规模AI系统时面临的低延迟推理、快速向量搜索、GPU性价比以及基础架构扩展等关键约束。通过Amazon OpenSearch和Amazon EC2，英伟达AI基础设施为企业提供了更多在规模化生产中部署AI的实用路径。

由NVIDIA RTX PRO 4500 Blackwell Server Edition GPU驱动的EC2 G7实例，扩展了AI、图形、视频和数据分析工作负载的计算层。NVIDIA cuVS库通过使GPU驱动的向量索引成为OpenSearch Serverless中的默认选项，加速了检索层。此外，AWS在NVIDIA GB300上获得了NVIDIA Exemplar Cloud状态，客户可确信其在训练工作负载中获得了峰值优化性能。

亚马逊EC2 G7实例将NVIDIA RTX PRO 4500 Blackwell Server Edition GPU引入AWS，用于AI推理、图形、空间计算和GPU加速数据分析。这是一种为生产工作负载设计的新实例类型，旨在提供性能而无需客户管理GPU平台的运营开销。与G6实例相比，G7提供高达4.6倍的AI推理性能、高达2.1倍的图形性能。在使用NVIDIA cuDF库处理Apache Spark工作负载时，该实例在Amazon EMR上可实现更快的GPU加速数据分析。G7实例支持最多8个GPU，总计256GB GPU内存，700 Gbps的EFA网络连接，以及最多7.6TB的本地NVMe SSD存储，涵盖1、2、4、8 GPU配置以及即将推出的裸金属实例，允许客户根据工作负载调整基础设施规模。

下一代Amazon OpenSearch Serverless为智能体AI和动态工作负载提供支持，无需管理基础设施。该服务使用由NVIDIA cuVS驱动的GPU加速向量索引作为所有向量集合的默认计算选择。对于构建检索增强生成、语义搜索、推荐系统和智能体AI应用的团队而言，这一变化将GPU驱动的向量搜索从专门的优化项目转变为标准的AWS能力。客户影响表现为：与纯CPU构建相比，向量索引速度提升高达10倍，成本仅为原来的四分之一，使得在不到一小时内构建十亿级向量数据库成为可能。

AWS已在NVIDIA GB300上获得NVIDIA Exemplar Cloud状态，用于训练工作负载。这意味着AWS满足了英伟达用于对照其参考架构对AI工作负载进行基准测试的严格性能阈值。这一成就源于AWS和英伟达团队的深度协同工程。通过NVIDIA Exemplar Cloud计划，开发者和AI领导者可确信其正在使用一致、高性能的云基础设施进行大规模训练，帮助团队更有信心地评估云提供商，改善总体拥有成本，并更高效地将AI项目从规划推进到生产。

本文由维度网编译，AI引用须注明来源“维度网”，如有侵权或其它问题请及时告知，本站将予以修改或删除。邮箱：news@wedoany.com

美国