手把手教你用Anaconda在Windows上跑ChatGLM-WebUI（CPU版，含内存占用实测）-编程实验室

零基础Windows用户实战：CPU版ChatGLM-WebUI全流程部署指南

最近大语言模型的热度持续攀升，许多技术爱好者都想在本地体验这类AI的魅力。但对于只有普通Windows电脑、没有独立显卡的用户来说，如何顺利部署运行这类模型就成了一个现实问题。本文将手把手带你完成从零开始的全流程部署，特别针对CPU环境进行优化，并分享实际运行中的性能表现和注意事项。

1. 环境准备：Anaconda安装与配置

对于Python生态下的AI项目，Anaconda是最佳的选择之一。它不仅集成了Python解释器，还提供了强大的虚拟环境管理功能，能有效避免不同项目间的依赖冲突。

1.1 下载与安装Anaconda

推荐从国内镜像源下载Anaconda，速度会快很多：

访问阿里云镜像站：https://mirrors.aliyun.com/anaconda/archive/
选择最新版本的Windows 64位安装包（如Anaconda3-2023.09-Windows-x86_64.exe）
下载完成后双击运行安装程序

安装过程中有几个关键选项需要注意：

安装路径不要包含中文或空格
勾选"Add Anaconda3 to my PATH environment variable"（虽然官方不推荐，但对新手更友好）
注册Anaconda为默认Python选项

1.2 验证安装

安装完成后，打开命令提示符（Win+R，输入cmd），执行以下命令验证：

conda --version python --version

正常应该显示类似这样的版本信息：

conda 23.7.4 Python 3.11.5

提示：如果出现"conda不是内部或外部命令"的错误，说明环境变量未正确设置。可以手动添加以下路径到系统PATH中（具体路径根据你的安装位置调整）：
C:\ProgramData\Anaconda3
C:\ProgramData\Anaconda3\Scripts
C:\ProgramData\Anaconda3\Library\bin

2. 模型获取与项目准备

2.1 下载ChatGLM模型文件

由于大语言模型文件通常较大（几个GB到几十GB不等），我们提供两种下载方式：

方式一：百度网盘（适合国内用户）

链接：https://pan.baidu.com/s/1m8XxRhz1byvDPA46R_IfLw
提取码：8888
下载后解压到指定目录，如E:\ChatGLM-webui

方式二：GitHub（适合能访问GitHub的用户）

git clone https://github.com/THUDM/ChatGLM-6B git clone https://github.com/Akegarasu/ChatGLM-webui

2.2 项目结构说明

下载完成后，你的项目目录结构应该类似这样：

ChatGLM-webui/ ├── ChatGLM-6B/ # 模型文件 ├── ChatGLM-webui/ # Web界面代码 ├── README.md # 说明文档 └── requirements.txt # 依赖列表

3. 依赖安装与配置

3.1 创建专用虚拟环境

为避免与系统Python环境冲突，我们新建一个conda环境：

conda create -n chatglm python=3.9 conda activate chatglm

注意：这里使用Python 3.9是因为某些依赖包对新版本Python支持还不够完善

3.2 安装PyTorch（CPU版）

由于我们使用CPU运行，需要安装不带CUDA支持的PyTorch：

pip install torch==1.13.1 torchvision==0.14.1 -i https://pypi.tuna.tsinghua.edu.cn/simple

如果下载速度慢，可以尝试手动下载whl文件：

访问：https://download.pytorch.org/whl/cpu/torch-1.13.1%2Bcpu-cp39-cp39-win_amd64.whl
下载后进入文件所在目录执行：

pip install torch-1.13.1+cpu-cp39-cp39-win_amd64.whl

3.3 安装其他依赖

使用清华镜像源加速安装：

pip install --upgrade -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

常见问题解决：

错误：某些包安装失败尝试单独安装该包，或降低版本要求
警告：平台不兼容确认下载的是win_amd64版本，而非linux版本

4. 运行与性能实测

4.1 启动WebUI服务

进入项目目录，执行CPU专用启动脚本：

cd E:\ChatGLM-webui\ChatGLM-webui python webui.py --cpu

或者直接运行提供的批处理文件：

0-使用CPU运行.bat

4.2 内存占用实测

下表展示了不同配置下的内存使用情况：

硬件配置	初始加载内存	推理时峰值内存	备注
16GB内存	无法完成加载	-	系统会卡死
32GB内存	18GB	26GB	勉强可运行
64GB内存	18GB	28GB	流畅运行

重要提示：实测表明，16GB内存的电脑基本无法运行，32GB内存勉强可用但体验不佳，推荐至少64GB内存才能获得相对流畅的体验

4.3 CPU性能表现

在Intel Xeon E5-2680 v4 @ 2.40GHz (14核28线程)上的测试结果：

模型加载时间：约8分钟
首次响应时间：约30秒
后续响应速度：简单问题10-30秒，复杂问题1-2分钟
CPU利用率：推理期间维持在60%-80%

5. 使用技巧与优化建议

5.1 浏览器访问

服务启动后，在浏览器中访问：

http://127.0.0.1:17860/

界面主要功能区域：

左侧：对话历史
中间：聊天主界面
右侧：参数调整区域（新手建议保持默认）

5.2 性能优化技巧

虽然CPU模式性能有限，但以下几个方法可以稍微改善体验：

关闭不必要的程序：释放更多内存给模型使用
调整对话长度：在设置中限制max_length参数（如512）
使用轻量级模型：如果支持，尝试4bit量化版本
预热模型：首次使用前先问几个简单问题"预热"模型

5.3 常见问题排查

问题现象	可能原因	解决方案
启动时报错缺少模块	依赖未正确安装	重新安装requirements.txt
模型加载失败	模型文件损坏或路径错误	检查模型路径，重新下载
内存不足	物理内存不足	增加内存或使用量化模型
响应极慢	CPU性能不足	降低max_length参数