技术选型对比

智能客服系统建设中的核心技术栈选型对比指南。

一、LLM 模型对比

主流模型对比

模型	推理能力	私有化部署	中文支持	适用场景
ChatGLM 系列	强	✅	优秀	请查阅最新版本
Qwen 系列	强	✅	优秀	请查阅最新版本
OpenAI GPT-4	极强	❌	良好	有 API 依赖
LLaMA	强	✅	一般	英文为主
DeepSeek	强	✅	优秀	国产开源

选型建议

可考虑：国内开源模型（ChatGLM / Qwen 系列）

理由：

支持本地私有化部署，可解决企业数据安全顾虑
中文理解能力强
免费开源，无 API 调用成本

注意：

请查阅各模型的最新版本，模型迭代较快
选择时需考虑：许可证、推理成本、上下文长度、工具调用能力、硬件适配等因素
建议在自己的场景中进行评测

不同场景选择

场景分析
    ↓
┌─────────────────────────────────────────┐
│ 需要私有化部署？                          │
│   → 选择 ChatGLM3-6B 或 Qwen-14b        │
├─────────────────────────────────────────┤
│ 追求极致性能，无数据安全顾虑？              │
│   → 选择 OpenAI GPT-4                   │
├─────────────────────────────────────────┤
│ 英文为主场景？                            │
│   → 选择 LLaMA 或 Mistral               │
└─────────────────────────────────────────┘

二、Embedding 模型对比

主流模型对比

模型	维度	多语言支持	适用场景	成本
Qwen3 Embedding	可变	100+ 语言	在多语言检索任务上表现优异	免费
OpenAI Embedding	1536	多语言	有 API 依赖	按量付费
AllMiniLmL6V2	384	英文为主	轻量级场景	免费
BGE Embedding	1024	多语言	多语言场景	免费

使用原则

必须遵循：存储阶段和检索阶段使用同一个 Embedding 模型

存储阶段: 文档 → Qwen3 Embedding → 向量存储
检索阶段: 问题 → Qwen3 Embedding → 向量检索
                ↑
           必须一致

三、向量数据库对比

主流数据库对比

数据库	类型	持久化	并发能力	适用场景
FAISS	内存型	❌	中等	快速原型、本地测试
Redis + RediSearch	缓存型	✅	高	热点知识缓存
Milvus	专用向量库	✅	高	生产环境首选
Chroma	轻量向量库	✅	中等	中小型项目
Elasticsearch	搜索引擎	✅	高	已有 ES 基础设施

选型决策树

需求分析
    ↓
┌─────────────────────────────────────────┐
│ 快速原型开发？                            │
│   → 选择 FAISS 或 Simple Vector Store   │
├─────────────────────────────────────────┤
│ 需要高并发缓存？                          │
│   → 选择 Redis + RediSearch             │
├─────────────────────────────────────────┤
│ 生产环境，海量数据？                       │
│   → 选择 Milvus                         │
├─────────────────────────────────────────┤
│ 已有 Elasticsearch 基础设施？             │
│   → 选择 Elasticsearch                  │
└─────────────────────────────────────────┘

配置注意事项

唯一标识符：设置 Memory Key 作为知识库的"数字指纹"
维度一致性：数据库维度必须与 Embedding 模型输出维度一致
索引优化：为高频查询字段建立索引

四、RAG 框架对比

主流框架对比

框架	特点	适用场景
LangGraph	状态机、持久化层	复杂多轮对话
LangChain	底层组件库、ReAct 模式	灵活定制
LlamaIndex	丰富的数据索引	RAG 优化
Haystack	端到端 NLP 流水线	企业级检索问答
n8n	可视化拖拽	快速原型
Dify	开源、知识问答	中小型项目

框架选择建议

需求分析
    ↓
┌─────────────────────────────────────────┐
│ 需要复杂多轮对话管理？                     │
│   → 选择 LangGraph                      │
├─────────────────────────────────────────┤
│ 需要灵活定制 RAG 流程？                   │
│   → 选择 LangChain 或 LlamaIndex        │
├─────────────────────────────────────────┤
│ 需要快速原型？                            │
│   → 选择 n8n 或 Dify                     │
├─────────────────────────────────────────┤
│ 已有 Java 业务后端？                      │
│   → 选择 Langchain4j                    │
└─────────────────────────────────────────┘

五、多智能体框架对比

主流框架对比

框架	特点	适用场景
LangGraph	底层流程控制、状态机	高度自定义、复杂工作流
CrewAI	角色扮演、团队协作	专家协同任务
AutoGen	对话模式、多 Agent 辩论	开放式问题求解

框架选择建议

需求分析
    ↓
┌─────────────────────────────────────────┐
│ 需要高度自定义工作流？                     │
│   → 选择 LangGraph                      │
├─────────────────────────────────────────┤
│ 需要专家协同任务？                        │
│   → 选择 CrewAI                         │
├─────────────────────────────────────────┤
│ 需要开放式问题求解？                       │
│   → 选择 AutoGen                        │
└─────────────────────────────────────────┘

六、不同规模企业的选型建议

初创团队 / 快速原型场景

组件	推荐选择
LLM	API 调用（OpenAI）或轻量级本地模型
Embedding	Qwen3 Embedding
向量数据库	FAISS 或 Simple Vector Store
RAG 框架	n8n 或 Dify
多智能体	简单编排或单 Agent

核心诉求：极低成本、敏捷上线

中型企业 / 生产级场景

组件	推荐选择
LLM	ChatGLM3-6B 或 Qwen-14b（私有化部署）
Embedding	Qwen3 Embedding
向量数据库	Milvus 或 Chroma
RAG 框架	LangGraph 或 LangChain
多智能体	LangGraph 或 CrewAI

核心诉求：稳定性、安全性、可扩展性

大型企业 / 高并发场景

组件	推荐选择
LLM	ChatGLM3-6B 或 Qwen-14b（私有化部署，多副本）
Embedding	Qwen3 Embedding
向量数据库	Milvus 集群 + Redis 缓存
图数据库	Neo4j 企业版
RAG 框架	LangGraph + 知识图谱
多智能体	自研或 LangGraph + CrewAI
规则引擎	Drools

核心诉求：高可用、高性能、数据安全

选型总结

企业规模
    ↓
┌─────────────────────────────────────────────────────────┐
│ 初创团队                                                 │
│ → 低代码平台 + API 调用 + 轻量级向量库                      │
├─────────────────────────────────────────────────────────┤
│ 中型企业                                                 │
│ → 私有化 LLM + LangGraph/CrewAI + Milvus                │
├─────────────────────────────────────────────────────────┤
│ 大型企业                                                 │
│ → 私有化 LLM 集群 + GraphRAG + Neo4j + 规则引擎           │
└─────────────────────────────────────────────────────────┘

七、参考资料

NotebookLM 智能客服与 AI Agent 工程 — 完整调研资料库

intent-classification

customer-service-building-guide

prompts

guides

categories

技术选型对比 ​

一、LLM 模型对比 ​

主流模型对比 ​

选型建议 ​

不同场景选择 ​

二、Embedding 模型对比 ​

主流模型对比 ​

推荐选择 ​

使用原则 ​

三、向量数据库对比 ​

主流数据库对比 ​

选型决策树 ​

配置注意事项 ​

四、RAG 框架对比 ​

主流框架对比 ​

框架选择建议 ​

五、多智能体框架对比 ​

主流框架对比 ​

框架选择建议 ​

六、不同规模企业的选型建议 ​

初创团队 / 快速原型场景 ​

中型企业 / 生产级场景 ​

大型企业 / 高并发场景 ​

选型总结 ​

七、参考资料 ​

技术选型对比

一、LLM 模型对比

主流模型对比

选型建议

不同场景选择

二、Embedding 模型对比

主流模型对比

推荐选择

使用原则

三、向量数据库对比

主流数据库对比

选型决策树

配置注意事项

四、RAG 框架对比

主流框架对比

框架选择建议

五、多智能体框架对比

主流框架对比

框架选择建议

六、不同规模企业的选型建议

初创团队 / 快速原型场景

中型企业 / 生产级场景

大型企业 / 高并发场景

选型总结

七、参考资料