美国UseBead工程师提出图增强RAG架构,突破向量搜索多跳推理瓶颈
2026-05-18 09:40
收藏

维度网讯,在企业AI应用加速向生产环境迁移的背景下,标准检索增强生成(RAG)架构的局限性正日益暴露。UseBead软件工程师Daulet Amirkhanov近日在VentureBeat发表技术文章,系统提出一种图增强RAG架构模式,通过将向量搜索的语义灵活性与图数据库的结构确定性相结合,解决传统向量搜索在多跳推理场景中的上下文丢失难题。

标准RAG架构的核心流程——文档分块、嵌入向量数据库、通过余弦相似度检索Top-K结果——在非结构化语义搜索中表现有效,但在供应链、金融合规、欺诈检测等企业级高度互联数据场景中频繁失效。Amirkhanov指出,向量数据库擅长捕捉语义,却舍弃了拓扑结构。文档被分块嵌入后,层次关系、依赖关系、所有权关系等显式连接往往被摊平或完全丢失。一个典型的供应链场景可以说明这种失效模式:结构化数据中,SQL数据库明确定义了“供应商A向工厂Y提供组件X”;非结构化数据中,一篇新闻报道称“泰国洪水已导致供应商A的工厂停产”。向量搜索可检索到这篇新闻,但无法将新闻事件与工厂Y的产出建立联系。LLM接收到新闻文本,却不具备回答“哪些下游工厂面临风险”这一业务问题的上下文,最终要么猜测关系链,要么在数据已存在的情况下返回“无法回答”。

为解决上述问题,Amirkhanov提出了一套三层混合检索架构。摄取层借鉴了他在Meta构建商店日志基础设施时学到的经验——结构必须在数据摄入阶段强制建立,无法事后从杂乱日志中重构。文档进入系统时即通过LLM或命名实体识别模型提取实体节点与关系边,并链接至图中已有记录。存储层采用Neo4j等图数据库存储结构图,向量嵌入则作为属性挂载在特定节点上。检索层执行混合查询:先通过向量扫描找到语义相似的入口节点,再从这些入口节点沿关系路径进行图遍历以收集完整上下文。

Amirkhanov在文章中还公开了一个基于Python、Neo4j和OpenAI的参考实现。该实现定义了连接非结构化风险事件与结构化供应链实体的图模式,并通过Cypher查询语言展示了混合检索的核心差异——系统并非简单返回Top-K文本块,而是先找到与查询语义匹配的实体(如供应商节点),再沿供应链关系路径(供应商→组件→工厂→客户)向下游拓展,直到完整链接至可能受影响的客户业务单元。

Milvus团队的研究指出,标准RAG在多跳问题上遭遇的根本障碍在于,答案依赖于向量搜索“看不见”的实体关系——连接问题与答案的桥接实体往往并未在问题中被提及。多份技术评测数据也印证了这一点:在涉及3跳以上的查询中,传统RAG准确率较简单查询下降57%,召回率不足40%;而GraphRAG通过单次图遍历即可串联公司→控股关系→子公司→高管→诉讼记录的完整推理链,准确率相比传统方案提升42%。微软的评估则显示,GraphRAG在企业场景下的答案全面性提升72%至83%,事实准确性提升3.4倍。

Amirkhanov强调,图增强RAG并非对向量搜索的替代,而是在其之上叠加了一层结构化推理能力。对于法规交叉引用、供应链风险评估、多实体关联查询等要求顺着关系链路而非仅匹配相似文本的场景,这一层补充性的图结构是决定系统能否给出可靠答案的关键。当前,UseBead已将这一架构模式应用于其自主Agent基础设施的合规审计场景中,为AI代理在高度互联的企业数据环境中的可靠部署提供检索基础。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com