维度网讯,IBM研究院与英伟达、三星合作,于2026年4月14日展示了一项内容感知存储系统原型。该系统在单台服务器上成功支持千亿级别向量的存储与检索,平均查询延迟为694毫秒,召回精度达90%。系统硬件组合为IBM Storage Scale ESS 6000全闪存设备、六颗英伟达H200 GPU以及48块三星30.72TB容量的PCIe Gen5 NVMe固态硬盘。
该方案的目标是降低企业部署检索增强生成(RAG)应用的基础设施复杂度和成本。IBM CAS 架构将文档向量化和索引构建等原本由独立计算层处理的任务,直接下沉至存储系统内部。IBM 存储首席技术官 Vincent Hsu 指出,随着 AI 部署规模指数级增长,企业迫切需要该量级的数据库来组织专有数据以供 AI 有效利用。当前市场上的向量数据库解决方案,往往需要跨越数十乃至数百台服务器横向扩展才能支撑数十亿级别的向量。
在硬件配置方面,三星提供了48块基于其最新一代 TLC V-NAND 闪存的企业级 NVMe 固态硬盘。每块硬盘提供 30.72TB 的存储容量,顺序读取速度最高达 12000 MB/s,顺序写入速度最高达 6800 MB/s。IBM Storage Scale ESS 6000 全闪存设备将计算与存储解耦,并通过英伟达 H200 GPU 加速索引重建,将原本基于 CPU 需耗时数小时的索引构建过程,缩短至 GPU 上的数分钟。
在实际性能验证中,系统加载和索引总共耗时 13 天,存储总数据占用空间为 153 TiB。作为对比,在双插槽英特尔 CPU 上完成同等规模任务预估需要 120 天。IBM 与英伟达的下一步目标是在一天内完成对超过千亿向量的索引,进一步缩短数据摄取时间,并借助英伟达 cuVS 库持续优化查询延迟。
这一原型展示为企业级 AI 应用的数据基础设施提供了新的思路,即通过将 AI 处理能力前移到存储层,有望在降低成本与管理复杂性的同时,提升对海量非结构化数据的利用效率。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告之,本站将予以修改或删除。邮箱:news@wedoany.com









