跳至主要內容

检索优化

mozzie小于 1 分钟

RAG 检索的一些优化手段,按从轻量到系统改造的递进顺序展开:

  1. 元数据过滤:最轻量。利用结构化字段做"先筛后查",提升准确率与性能,改造成本最低。
  2. 混合检索:召回层升级。稠密向量 + 稀疏向量双路召回并融合,兼顾语义与关键词。
  3. 查询重构:Query 层增强。在检索前引入 LLM 做改写、拆分、退步或 HyDE,让 Query 更贴近文档。
  4. 查询路由:架构级扩展。按意图把问题分发到合适的知识库、工具或检索策略,适用于多库多源场景。
贡献者: mozzie