RAG（检索增强生成）

将外部知识检索与大语言模型生成能力结合的技术架构，解决纯参数化模型在知识时效性、事实准确性方面的固有缺陷。

Key Points

核心流程：问题向量化 → 向量数据库检索 → 融合生成 → 返回答案
解决大模型"幻觉"问题，确保回答有文档依据
已成为企业构建智能应用的核心基础设施

Details

技术演进

传统RAG（2023）：向量检索 + BM25，简单Chunk，局限在于跨文档推理差
高级RAG（2024）：Query重写、多路召回、Reranker精排、上下文压缩
GraphRAG（2024）：知识图谱作为结构化索引，实体-关系-社区三层检索
Agentic RAG（2025）：Agent自主决定检索策略，多知识库动态查询

核心组件

Embedding模型：将文本转换为高维向量
向量数据库：存储和检索向量（Milvus、Chroma、FAISS）
Chunk策略：文本分块大小直接影响检索效果
检索策略：多路召回（向量+BM25+知识图谱）+ Cross-Encoder精排
生成控制：Prompt约束、参数调优、安全过滤

常见失败模式

提示词注入：恶意指令绕过系统限制
上下文搜索失效：多轮对话中代词指代不明
跨文档推理失败：复杂问题召回率不足60%
窗口溢出：对话历史超出Token限制

Context

出现在智能客服专栏多篇文章中，是构建智能客服的核心技术底座。

[[concepts/graph-rag]]
[[concepts/knowledge-graph]]
[[products/langchain]]
[[products/llamaindex]]
[[patterns/rag-implementation]]
[[patterns/intelligent-customer-service]]

Sources