美国Zilliz发布Vector Lakebase公开预览版
2026-06-11 09:38
收藏

维度网讯,2026年6月10日,位于加利福尼亚州雷德伍德城的Zilliz公司宣布,其Zilliz Vector Lakebase(向量湖基座)进入公开预览阶段。这是一项重要的Zilliz Cloud版本更新,旨在将生产级向量数据库与共享的湖原生数据基础相结合。

Vector Lakebase以Zilliz Cloud的实时向量搜索为核心,该引擎已服务于Zillow、OpenEvidence、Exa、Filevine、MiniMax及超过10,000家企业与AI团队。此次更新扩展出三种操作同一数据的新方式:交互式发现、大规模批量分析以及直接对外部数据湖进行搜索。其结果是形成一个单一数据基础,所有工作负载均针对数据的单一逻辑副本运行,按需和批量任务仅在计算活跃时计费。

Zilliz创始人兼CEO Charles Xie表示,生产级向量搜索是公司的核心,也是数千个团队选择Milvus和Zilliz Cloud的原因。Vector Lakebase是Zilliz认为的下一步发展方向:一个数据基础,同一向量可服务于生产查询、支撑发现会话,并驱动PB级训练数据管道,无需副本、迁移或并行堆栈。

在单一数据基础的重要性方面,AI系统已不再是单一查询检索问题。它们以持续循环的方式运行,包括提供服务、从反馈中学习、挖掘并准备更好的数据,然后再次提供服务。每个环节通常需要独立的系统来处理服务、探索和大规模处理。在这些系统之间移动数十亿向量可能需要数天时间。Vector Lakebase通过在共享的湖原生存储上构建零拷贝语义数据平面来弥合这一差距,使实时服务、交互式发现和批量分析均针对数据的单一逻辑副本运行,规模从GB级扩展到PB级。

Zilliz产品副总裁兼Milvus架构师之一Robert Guo表示,团队希望找到一种方法,将数据保存在一处,并针对其运行截然不同的工作负载。Vector Lakebase通过Vortex上的统一存储层、生产路径的分层服务以及针对其他所有需求的计算按需分配来实现这一目标。

Vector Lakebase在单一基础上具备五大能力。首先,分层实时服务提供三种针对不同工作负载优化的生产层:性能优化型(1000+ QPS,个位数毫秒延迟,内存)、容量优化型(100–500 QPS,100ms以下延迟,内存加NVMe)以及分层存储型(10–50 QPS,约100ms延迟,横跨内存、NVMe和对象存储,成本显著降低)。所有层默认召回率为95–98%,可调至99%以上,并受Zilliz Cloud的99.99%正常运行时间SLA和全球集群跨区域高可用性支持。其次,按需搜索针对基础设施大部分时间闲置的工作负载提供按需付费计算,直接对对象存储和计算计费。Zilliz内部对10亿768维向量、每月10小时活跃计算的基准测试显示,按需搜索总计花费318美元,而类似的无服务器路径则需要4,937美元,成本约为后者的1/15。第三,外部数据湖搜索是一种零拷贝外部集合模式,可直接向现有的Lance、Iceberg、Parquet和Vortex表添加最先进的索引和全频谱搜索,并在刷新时进行增量同步,源数据保留在其所在位置。第四,全频谱AI搜索支持跨向量(密集与稀疏)、文本、JSON和地理空间数据进行搜索,支持混合检索、BM25、正则表达式、多向量与迭代搜索以及多路径检索,结果可使用Cohere、Voyage AI、RRF以及加权、增强或衰减策略进行重排序。第五,统一湖原生存储基于Vortex构建服务与分析共享存储,Vortex是一种开放列式格式,设计用于比Lance和Parquet更快、更便宜的随机读取,并搭配对象存储感知索引,将读放大降低90%以上。一个1亿行的模式回填通常可在个位数分钟内完成,且不中断活跃查询流量。

这些能力共同使AI团队能够将以往需要的并行常开服务集群和独立的批量系统整合到一个平台上,具备一致的索引、版本化的数据以及可在任务间缩减至零的计算资源。

Zilliz Vector Lakebase现已在Zilliz Cloud上公开预览,同时提供无服务器、专用和BYOC部署选项,覆盖AWS、Google Cloud和Microsoft Azure的30多个区域。使用工作邮箱注册可获100美元免费额度。在独立堆栈上运行服务、发现和分析的团队可联系Zilliz团队获取定制引导。

Zilliz是一家AI数据基础设施公司,也是开源向量数据库Milvus的创建者,该数据库拥有44,000多个GitHub星标和超过1亿次Docker拉取。Zilliz帮助企业和AI初创公司使其非结构化数据可搜索、可分析和可治理。其技术以Milvus和Zilliz Cloud为核心。Milvus是一个专为千亿级向量搜索而构建的开源向量数据库。Zilliz Cloud将该基础扩展为完全托管的Vector Lakebase平台,结合了向量数据库的高吞吐量、低延迟服务能力与多模态数据湖的开放性、可扩展性和经济性。Zilliz为全球超过10,000家企业和AI原生初创公司提供支持,包括MiniMax、OpenEvidence、Filevine、Exa、Salesforce和Read AI。公司总部位于加利福尼亚州雷德伍德海岸,由Aramco的Prosperity 7 Ventures、淡马锡的Pavilion Capital、高瓴资本、5Y Capital、云启资本和挚信资本等投资者支持。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com