Langchain-Chatchat 搭建本地知识库实战-编程实验室

Langchain-Chatchat 搭建本地知识库实战

在企业数字化转型加速的今天，如何高效管理和利用海量内部文档成为一大挑战。制度文件、技术手册、产品说明散落在各个角落，员工查找信息耗时费力，新员工上手慢，客服响应不及时……这些问题背后，其实都指向一个核心需求：构建一个懂业务的智能知识助手。

而如今，借助开源项目Langchain-Chatchat，我们无需依赖云服务，也能在本地部署一套真正属于自己的 AI 问答系统。它不仅能理解你的私有文档，还能以自然语言精准作答，关键是——所有数据都不出内网，安全可控。

本文将带你从零开始，基于Langchain-Chatchat v0.3.0版本，使用离线中文嵌入模型bge-base-zh-v1.5和在线大模型接口（智谱AI），完整走通部署流程，并分享我在实际测试中总结出的关键优化技巧。

环境准备：硬件与软件的合理搭配

要让这套系统跑得稳、响应快，合适的环境配置是前提。以下是本次实测所用的配置：

处理器：Intel i7-10700K
内存：32 GB DDR4
显卡：NVIDIA RTX 3060（12GB 显存）
硬盘：512GB NVMe SSD + 2TB HDD
操作系统：Windows 11 Pro
Python 版本要求：3.11+
CUDA 支持版本：12.1

特别提醒：虽然 CPU 可运行全流程，但文本向量化阶段对计算资源消耗较大。如果你计划处理上百页 PDF 或频繁更新知识库，强烈建议配备支持 CUDA 的 NVIDIA 显卡。实测表明，启用 GPU 后 embedding 生成速度提升可达 3~5 倍。

部署全过程详解

获取源码并切换版本

首先克隆官方仓库。推荐使用 SSH 协议避免 HTTPS 认证麻烦：

git clone git@github.com:chatchat-space/Langchain-Chatchat.git cd Langchain-Chatchat

稳定性和兼容性很重要，因此我们切换到已发布的稳定分支：

git checkout v0.3.0

创建独立虚拟环境

为避免 Python 依赖冲突，建议使用 Conda 创建隔离环境：

conda create -n chatchat python=3.11.7 conda activate chatchat

激活后确保当前环境正确：

python --version # 应输出 3.11.7

安装依赖包

项目依赖复杂，建议先升级 pip 再安装主依赖：

pip install --upgrade pip pip install -r requirements.txt

若需接入第三方 LLM API（如本文使用的智谱AI），还需额外安装 SDK：

pip install zhipuai==1.1.2

小贴士：部分依赖可能因网络问题安装失败，可尝试更换国内镜像源，例如清华 TUNA：
bash pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/

下载 Embedding 模型

Embedding 模型决定了系统“理解”文本的能力。中文场景下，我推荐bge-base-zh-v1.5——由北京智源研究院发布，在多个中文语义匹配任务中表现优异。

通过 ModelScope 下载：

git lfs install git clone https://www.modelscope.cn/AI-Module/bge-base-zh-v1.5.git models/bge-base-zh-v1.5

建议统一存放于项目根目录下的models/文件夹中，便于后续管理。这个模型约 400MB，加载时会自动识别是否支持 GPU。

配置参数文件

首次运行前需要复制默认配置模板：

python copy_config_example.py

该脚本会将config_example/中的所有.py文件复制到config/目录下。

接下来重点修改config/model_config.py。

设置模型路径根目录

MODEL_ROOT_PATH = "E:\\LLM\\Langchain-Chatchat\\models"

注意路径分隔符使用双反斜杠或原始字符串（r"E:\..."），否则在 Windows 上会报错。

指定 Embedding 模型

EMBEDDING_MODEL = "bge-base-zh-v1.5"

只要模型放在models/目录下且名称一致，即可被自动识别。

接入智谱AI在线 API

为了获得更强的语言生成能力，我们采用在线调用方式接入GLM-4模型。

首先注册智谱开放平台并获取 API Key。

然后在配置文件中设置：

LLM_MODELS = ["zhipu-api"] ONLINE_LLM_MODEL = { "zhipu-api": { "api_key": "your_api_key_here", # 替换为真实密钥 "version": "glm-4", "provider": "ChatGLMWorker", "device": "auto" # 自动选择可用设备 } }

这里的device="auto"很实用：当 GPU 可用时优先使用，否则退回到 CPU，适合多环境部署。

初始化向量数据库

Langchain-Chatchat 默认使用 FAISS 作为向量数据库，存储路径为data/vectordb。

执行初始化命令：

python init_database.py --recreate-vs

但在 Windows 系统上，你可能会遇到如下错误：

ModuleNotFoundError: No module named 'pwd'

这是因为pwd是 Unix/Linux 系统模块，Windows 不原生支持。

解决方案：手动创建pwd.py并放入虚拟环境的 Lib 目录下（通常位于anaconda3/envs/chatchat/Lib/）：

# pwd.py import os def getpwuid(uid): return ('user', 'password', uid, 0, '', '', '') def getuid(): return 1000 def get_username(): return "chatchat_user"

保存后重新运行初始化命令即可成功。

启动服务：一键拉起全栈应用

Langchain-Chatchat 提供了一键启动脚本，极大简化了部署流程：

python startup.py -a

该命令会依次启动：
- FastChat API 服务（端口 20000）
- Chatchat 自身 API（端口 7861）
- Streamlit WebUI 界面（端口 8501）

启动成功后，终端会输出类似日志：

==============================Langchain-Chatchat Configuration============================== 操作系统：Windows-11-10.0.22621-SP0 python版本：3.11.7 (main, Dec 15 2023) 项目版本：v0.3.0 langchain版本：0.1.0. fastchat版本：0.2.38 当前使用的分词器：ChineseRecursiveTextSplitter 当前启动的LLM模型：['zhipu-api'] @ gpu {'api_key': 'y***g', 'device': 'cuda', 'online_api': True, 'port': 21001, 'provider': 'ChatGLMWorker', 'version': 'glm-4'} 当前Embeddings模型： bge-base-zh-v1.5 @ gpu 服务端运行信息： OpenAI API Server: http://127.0.0.1:20000/v1 Chatchat API Server: http://127.0.0.1:7861 Chatchat WEBUI Server: http://127.0.0.1:8501 ==============================Langchain-Chatchat Configuration============================== You can now view your Streamlit app in your browser. URL: http://127.0.0.1:8501

打开浏览器访问http://127.0.0.1:8501，即可进入图形化操作界面。

实战体验：上传文档并提问

进入 WebUI 后，点击左侧菜单「知识库管理」→「新建知识库」。

支持上传多种格式：
-.txt,.pdf
-.docx,.doc
-.xlsx,.csv
-.md,.html

我上传了一份公司智能门锁的产品说明书 PDF，系统后台自动完成以下流程：

加载文件→ 解析二进制内容
读取文本→ 提取纯文本（支持图文混排）
文本分割→ 使用ChineseRecursiveTextSplitter按段落切分
文本向量化→ 调用bge-base-zh-v1.5生成 embedding
存入向量库→ 写入 FAISS 数据库供检索

处理完成后，返回「对话」页面，选择对应的知识库名称，就可以开始提问了。

输入问题：

“我们公司的智能门锁支持哪些开锁方式？”

系统结合文档内容返回：

“支持指纹识别、密码输入、手机蓝牙解锁、IC卡刷卡及远程临时授权五种方式。”

准确率令人满意。更关键的是，整个过程无需联网传输敏感资料，完全本地闭环。

性能优化策略：从“能用”到“好用”

基础功能跑通只是第一步。要想实现高质量、高效率的问答体验，以下几个方面的调优必不可少。

启用 GPU 加速，显著提升向量化速度

尽管配置了device="auto"，但仍需确认 PyTorch 是否真正启用了 CUDA。

安装对应版本的 PyTorch（CUDA 12.1）：

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

验证 GPU 可用性：

import torch print(torch.cuda.is_available()) # 输出 True 表示成功 print(torch.__version__)

重启服务后，查看日志是否显示：

当前Embeddings模型： bge-base-zh-v1.5 @ cuda

一旦看到@ cuda，说明模型已在 GPU 上运行。实测结果显示，相同文档向量化时间从近两分钟缩短至 30 秒左右，效率提升明显。

更换更高性能的 Embedding 模型

bge-base-zh-v1.5已经不错，但如果你追求更高的召回准确率，可以尝试以下替代方案：

模型名称	来源	特点
`bge-large-zh-v1.5`	BAAI	参数更多，精度更高，适合专业文档
`text2vec-base-chinese`	智源	轻量级，低配机器友好
`m3e-base`	MokaAI	中文专用，社区活跃

只需下载模型并放入models/目录，然后修改EMBEDDING_MODEL配置即可无缝切换。无需更改其他代码，非常方便。

调整文本分块策略，平衡上下文完整性与检索精度

默认配置为chunk_size=500,chunk_overlap=50，适用于大多数通用场景。

但对于结构复杂的文档（如法律合同、技术白皮书），过大的块可能导致关键信息被稀释；太小又容易丢失上下文。

我的经验是：适当减小块大小，增加重叠长度。

编辑config/kb_config.py：

CHUNK_SIZE = 300 # 减少单块字符数，提高粒度 CHUNK_OVERLAP = 60 # 增加重叠，保留句子连贯性

调整后重建知识库，发现模型在回答细节问题时表现更好，比如“第 3.2 节提到的安全认证标准是什么？”这类定位性强的问题命中率显著上升。

优化提示词模板，引导模型输出更规范答案

Langchain-Chatchat 允许自定义 prompt 模板，位于prompts/q_a_prompt.txt。

原始模板较为通用，缺乏约束，有时会出现过度发挥的情况。

我将其改为更具引导性的结构：

你是一个专业的客服助手，请根据以下上下文信息回答用户问题。 请保持回答简洁、准确，不要编造内容。若无法找到答案，请回复“暂无相关信息”。 【上下文】 {context} 【问题】 {question} 【回答】

这样做的好处是：
- 明确角色定位，减少“AI幻觉”
- 强调依据上下文作答，避免自由发挥
- 统一输出格式，便于后期集成到业务系统

保存后重启服务即可生效。你会发现模型的回答变得更加克制和可靠。

应用场景与未来扩展方向

这套系统远不止是个“文档搜索引擎”，它的潜力在于深度融入企业的日常运作。

典型应用场景

企业内部知识库：整合制度文档、操作手册、FAQ，新人入职三天就能上手
技术支持中心：一线工程师快速检索故障排查方案，平均响应时间缩短 60%
教育培训系统：构建课程答疑机器人，学生随时提问，老师减轻重复劳动
医疗健康咨询：基于医学指南提供辅助建议（需配合合规审核机制）

可行的扩展方向

完全离线运行：替换为 Qwen、ChatGLM3、Baichuan 等本地大模型，彻底摆脱对外部 API 的依赖
多租户支持：改造数据库结构，实现不同部门拥有独立知识空间
API 对接业务系统：通过 RESTful 接口将问答能力嵌入 OA、CRM、ERP 等现有平台
权限控制增强：基于用户角色限制知识库访问范围，满足企业安全管理需求

特别是第一条——本地化 LLM + 本地 Embedding + 本地向量库，可以打造出真正意义上的“私有 AI 助手”，既安全又可控，非常适合对数据敏感的金融、政务、医疗等行业。

Langchain-Chatchat 之所以能在众多开源项目中脱颖而出，正是因为它兼顾了功能性、灵活性与安全性。它不像某些“黑盒式”SaaS 产品那样把数据交出去，也不像纯研究型项目那样难以上手。

通过合理的配置与持续的调优，即使是中小企业也能以极低成本搭建出高效、可靠的智能问答系统。这不仅是技术的胜利，更是“数据主权回归用户”的一次实践。

现在就开始动手吧，让你的知识资产真正“活”起来。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

Langchain-Chatchat 搭建本地知识库实战