Skip to content

知识图谱构建方案 v2

基于联网调研的对抗性分析版本,对原有知识图谱构建方案进行勘误、丰富与升级。聚焦 2025-2026 年 GraphRAG 最新实践。


一,原版问题总结

原版「知识图谱构建方案」存在以下不足:

  1. 未提及最新 benchmark:腾讯优图 2025 年发布了 GraphRAG-Bench,原版未引用
  2. 构图质量方案过时:未涉及 AutoSchemaKG 和腾讯优图异构图谱方案
  3. 未提及 Query 理解模块:腾讯优图首次提出将图谱 Schema 应用到复杂 Query 理解,原版未涉及
  4. 未提及知识图谱更新机制:生产级知识图谱需要持续演进,原版仅提到一次性构建

二、GraphRAG 技术演进

两大技术路线

路线代表方案优点缺点
以知识图谱为主要知识组织微软 GraphRAG、LightRAG知识粒度细构图和检索质量/效率偏低
异构图谱融合腾讯优图 GraphRAG效果和效率均贴近生产可用实现复杂度高

腾讯优图异构图谱方案(v2 重点推荐)

节点类型(三种):
├─ 实体/关系节点 → 连接语义单元
├─ 属性节点 → 表示实体特征
└─ 社区节点 → 总结社区核心信息

异构图优势:
├─ 构图成本比微软 GraphRAG 低 50%+
├─ 回答准确率比微软 GraphRAG(Global) 提升 200%+
├─ 比 LightRAG 提升 20-100%
└─ 效果和效率均贴近生产可用

三、GraphRAG Benchmark(腾讯优图,2025)

背景

当前 GraphRAG 技术仍处于初期阶段,业界缺少专门的评测规范和数据集。

腾讯优图发布了自研的 GraphRAG-Bench,包含:

评测数据:
├─ 多领域构建(金融、医疗、电商等)
├─ 不同类型的问题(单跳、多跳、对比、推理)
└─ 完备的评估流程

评估维度:
├─ 检索质量
├─ 回答质量
├─ 推理能力(重点)
└─ 综合评分

发现:
├─ 所有 RAG 方法均显著提高了 LLM 的推理能力
├─ HippoRAG 和 RAPTOR 在推理能力上表现最佳
└─ 与检索有用信息的能力密切相关

四、AutoSchemaKG:Schema 驱动的图谱构建

核心思路

腾讯优图和 AutoSchemaKG 提出将图 Schema 应用于构图质量提升

步骤:
1. 定义 Graph Schema(实体类型 + 关系类型)
2. LLM 根据 Schema 从文档中抽取三元组
3. Schema 约束保证图谱质量

三种方式:
├─ 预置模板(直接选用)
├─ 自定义设置(手动配置)
└─ AI 一键扩展(LLM 自动推理补充)

腾讯优图 Schema 方案

核心创新:Schema 感知的复杂 Query 理解
├─ Agent 对 Schema 理解
├─ 挖掘 {Entity} / {Relation} / {Attribute}
├─ 依存句法分析
└─ 多跳转单跳子任务解耦

效果:显著提升复杂多跳问题回答质量

五、知识图谱构建流水线

三阶段构建

阶段 1:知识抽取
├─ 使用 LLM 识别关键实体
│   如:「会员等级」「积分」「门槛金额」「限制条件」
├─ 识别实体间关系
│   如:「X 升级到 Y 的条件是」「A 不适用于 B 产品」
└─ 目标文档:PDF 制度文件、PPT 培训材料、网页说明、历史工单

阶段 2:半自动校对和入库
├─ LLM 抽取 → 可视化界面人工审核
├─ 纠正错误
├─ 合并重复实体
└─ 调整图谱结构

阶段 3:增量更新流水线
├─ 版本管理(历史问答可追溯到当时生效规则)
├─ 新政策/产品文档上传
├─ 自动触发「抽取 → 校验 → 入库」流程
└─ 图谱持续演进

六、GraphRAG 问答流程

完整流程

用户问题
    ↓
1. Query 理解
   ├─ 意图识别(FAQ / 知识图谱查询 / 跨文档推理)
   └─ 实体定位(从问题中抽取关键实体)

2. 检索策略选择
   ├─ Local(局部精准):具体实体查询
   └─ Global(全局推理):跨实体对比分析

3. 图谱检索
   ├─ 实体匹配
   ├─ 关系路径扩展
   └─ 社区汇总获取上下文

4. 结果融合
   └─ 图谱结果 + 文档片段 → LLM 生成

5. 输出审核
   └─ 合规过滤 → 最终回复

腾讯云 GraphRAG 操作流程

知识管理 → 上传文档 → 生成图谱

图谱设置阶段:
├─ 选择知识范围(核心文档优先)
├─ 设置 Graph Schema
│   ├─ 预置模板
│   ├─ 自定义设置
│   └─ AI 一键扩展
└─ 单击「生成图谱」(耗时较长,可关闭页面)

图谱构建完成后:
├─ 查看整体统计信息
├─ 点击实体/属性/关系筛选
└─ 图谱画布可视化操作

检索问答:
├─ 标准模式应用(目前仅支持)
└─ 开启知识图谱检索开关

七、知识图谱更新机制

持续演进原则

图谱不是一次性项目,而是持续演进的「活系统」

更新策略:
├─ 增量更新(新文档 → 自动触发流水线)
├─ 版本管理(可追溯、可回滚)
├─ 定期重构(季度/半年度全局优化)
└─ 运营反馈驱动(用户问题驱动知识缺口发现)

八、关键修正总结

原版问题v2 修正
未提及 GraphRAG benchmark新增腾讯优图 GraphRAG-Bench 及评测发现
未提及 AutoSchemaKG新增 Schema 驱动的图谱构建方案
未提及异构图谱方案新增腾讯优图三种节点类型异构图
未提及 Schema 感知 Query新增腾讯优图 Schema 感知复杂 Query 理解
未提及增量更新机制新增三阶段持续演进流水线
未提及知识图谱选型新增两大技术路线对比和选择建议

九、参考资料

Released under the MIT License.