RAG

mozzie大约 2 分钟

AgentScope 中的 RAG 模块由两个核心组件组成：

AgentScope 支持多种类型的知识库实现：

AgentScope提供了两种集成模式

模式	描述	优点	缺点
Generic 模式	在每个推理步骤之前自动检索和注入知识	简单，适用于任何 LLM	即使不需要也会检索
Agentic 模式	Agent 使用工具决定何时检索	灵活，只在需要时检索	需要强大的推理能力

通过Hook机制在推理前自动注入

工作原理：

.ragMode(RAGMode.GENERIC)

通过Tool 机制由 Agent主动调用

工作原理：

.ragMode(RAGMode.AGENTIC

分块大小：根据模型的上下文窗口和使用场景选择分块大小。典型值：256-1024 个字符。
重叠：使用 10-20% 的重叠以保持块之间的上下文连续性。
分数阈值：从 0.3-0.5 开始，根据检索质量调整。
Top-K：初始检索 3-5 个文档，根据上下文窗口限制调整。
模式选择：
- 使用 Generic 模式：简单问答、一致的检索模式、较弱的 LLM
- 使用 Agentic 模式：复杂任务、选择性检索、强大的 LLM
向量存储选择：
- 使用 InMemoryStore：开发、测试、小型数据集（<10K 文档）
- 使用 QdrantStore：生产环境、大型数据集、需要持久化
- 使用 ElasticsearchStore: 生产环境、大型数据集、私有部署服务。