跳至主要內容

RAG 评估

mozzie小于 1 分钟

RAG 评估关注一个核心问题:系统给出的答案到底能不能信。

这一部分按评估体系 -> 指标拆解 -> 工具落地的顺序展开:

  1. RAG 评估体系与指标:从 RAG Triad 出发,拆解检索评估、响应评估和端到端评估。
  2. RAG 评估常用工具:对比 LlamaIndex Evaluation、RAGAS、Phoenix 的定位、指标和适用场景。
贡献者: mozzie