美国英伟达与AWS合作实现10倍向量索引提速
2026-06-26 09:51
收藏

维度网讯,2026年6月25日,英伟达(NVIDIA)与亚马逊云服务(AWS)近期开展合作,旨在解决构建大规模AI系统时面临的低延迟推理、快速向量搜索、GPU性价比以及基础架构扩展等关键约束。通过Amazon OpenSearch和Amazon EC2,英伟达AI基础设施为企业提供了更多在规模化生产中部署AI的实用路径。

由NVIDIA RTX PRO 4500 Blackwell Server Edition GPU驱动的EC2 G7实例,扩展了AI、图形、视频和数据分析工作负载的计算层。NVIDIA cuVS库通过使GPU驱动的向量索引成为OpenSearch Serverless中的默认选项,加速了检索层。此外,AWS在NVIDIA GB300上获得了NVIDIA Exemplar Cloud状态,客户可确信其在训练工作负载中获得了峰值优化性能。

亚马逊EC2 G7实例将NVIDIA RTX PRO 4500 Blackwell Server Edition GPU引入AWS,用于AI推理、图形、空间计算和GPU加速数据分析。这是一种为生产工作负载设计的新实例类型,旨在提供性能而无需客户管理GPU平台的运营开销。与G6实例相比,G7提供高达4.6倍的AI推理性能、高达2.1倍的图形性能。在使用NVIDIA cuDF库处理Apache Spark工作负载时,该实例在Amazon EMR上可实现更快的GPU加速数据分析。G7实例支持最多8个GPU,总计256GB GPU内存,700 Gbps的EFA网络连接,以及最多7.6TB的本地NVMe SSD存储,涵盖1、2、4、8 GPU配置以及即将推出的裸金属实例,允许客户根据工作负载调整基础设施规模。

下一代Amazon OpenSearch Serverless为智能体AI和动态工作负载提供支持,无需管理基础设施。该服务使用由NVIDIA cuVS驱动的GPU加速向量索引作为所有向量集合的默认计算选择。对于构建检索增强生成、语义搜索、推荐系统和智能体AI应用的团队而言,这一变化将GPU驱动的向量搜索从专门的优化项目转变为标准的AWS能力。客户影响表现为:与纯CPU构建相比,向量索引速度提升高达10倍,成本仅为原来的四分之一,使得在不到一小时内构建十亿级向量数据库成为可能。

AWS已在NVIDIA GB300上获得NVIDIA Exemplar Cloud状态,用于训练工作负载。这意味着AWS满足了英伟达用于对照其参考架构对AI工作负载进行基准测试的严格性能阈值。这一成就源于AWS和英伟达团队的深度协同工程。通过NVIDIA Exemplar Cloud计划,开发者和AI领导者可确信其正在使用一致、高性能的云基础设施进行大规模训练,帮助团队更有信心地评估云提供商,改善总体拥有成本,并更高效地将AI项目从规划推进到生产。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com