ComfyUI 部署 FLUX.1 GGUF 量化模型完整技术教程-编程实验室

一、FLUX.1 模型简介

FLUX.1 是由 Black Forest Labs 团队研发的文生大模型，该团队核心成员为原 Stable Diffusion 项目主创人员。模型参数规模达 120 亿，采用多模态 Transformer + 扩散模型混合架构，在语义理解、图像生成表现上有显著优化。

官方共推出三个版本，定位与授权规则各不相同：

FLUX.1 [pro]：闭源商业版本，仅支持 API 调用，图像生成质量最优；
FLUX.1 [dev]：开放权重版本，禁止商用，生成效果接近 pro 版，支持本地部署；
FLUX.1 [schnell]：基于 Apache 2.0 协议开源、可商用，生成速度相比 dev 版本提升约 10 倍，画质略有下降。

普通个人用户主要选择dev和schnell版本进行本地运行。

模型核心特性

提示词理解能力强：可精准解析包含多物体、空间位置关系的复杂描述，元素排布准确率优于同类型主流模型；
文字生成优化：改善传统 AI 绘图文字乱码、字符变形问题，图像内文字生成可用性大幅提升；
人体结构渲染改进：降低手指畸形、肢体扭曲等常见错误的出现概率；
分辨率适配广泛：支持 10 万～200 万像素区间、任意长宽比的图像生成，不局限于正方形画布；
本地离线运行：权重文件下载完成后，无需联网即可推理，适合批量生成、隐私化创作场景。

二、硬件要求说明

FLUX.1 原版模型硬件门槛较高，社区推出的 GGUF 量化版本大幅降低显存需求，同时还有 FP8 压缩版本可供选择。

1. 不同版本硬件参数

FP8 压缩版

显存：12GB ~ 16GB
内存：≥16GB
存储占用：约 17GB

GGUF 量化版（本文主力部署版本）

由社区开发者优化，提供多档量化精度，画质与显存占用呈梯度变化：

表格

量化档位	最低显存	文件体积	画质损耗
Q2	6GB	约 3.5GB	画质下降明显
Q4	6GB ~ 8GB	约 6.5GB	轻微损耗
Q5	8GB	约 8GB	损耗极低
Q6	10GB	约 10GB	几乎无损耗
Q8	12GB	约 13GB	基本无损耗

补充实测：6GB 显存设备运行 Q4 版本，512×512 分辨率单图生成耗时数分钟；8GB 显存优先选择 Q5 版本，为综合体验最优方案。RTX 3060、RTX 4060 等主流消费级显卡均可适配 GGUF 量化版。

2. 整体运行环境

操作系统：Windows 10 / Windows 11（64 位）
运行环境：Python 3.10 及以上
显卡：NVIDIA 显卡，支持 CUDA 加速
内存：建议≥16GB，推荐 32GB
硬盘：可用空间≥20GB

三、主流文生模型横向对比

表格

对比维度	FLUX.1 [dev]	Stable Diffusion 3	Midjourney v6	DALL·E 3
开源属性	开放权重（禁止商用）	开放权重（可商用）	闭源	闭源
本地部署	支持	支持	不支持（仅云端）	不支持（仅云端 / API）
参数规模	120 亿	20 亿	未公开	未公开
量化后最低显存	6GB（GGUF Q4）	6GB	不适用	不适用
提示词理解	优秀	中等	优秀	优秀
图像文字生成	较好	一般	中等	中等
人体 / 肢体渲染	较好	一般	较好	一般
生成速度	中等	中等	云端较快	云端较快
使用费用	本地免费	本地免费	订阅付费	按量 / 订阅付费
画布比例支持	全比例兼容	支持	支持	支持
LoRA 扩展	生态逐步完善	生态成熟	不支持自定义扩展	不支持自定义扩展
商用权限	禁止商用	部分版本可商用	支持商用订阅	需商用协议

参考实测：在复杂构图场景下 FLUX.1 提示词跟随度表现突出；人像皮肤质感方面 Midjourney 略有优势，整体各有侧重。

四、部署前置资源准备

需要提前准备的文件：

ComfyUI 整合包（内置 Python 环境，免去手动配置）；
ComfyUI-GGUF 专用插件；
FLUX.1 GGUF 主模型（根据显存选择对应量化版本）；
T5-XXL（GGUF 版）文本编码器；
CLIP-L 模型；
ae.safetensors（VAE 模型）。

资源统一下载保存地址：https://pan.baidu.com/s/1P63ziOhxvUQqbHZC8OnHaA?pwd=5555 提取码: 5555

五、分步安装与部署教程

步骤 1：部署 ComfyUI 主程序

将下载的 ComfyUI 整合包解压，解压路径禁止包含中文、空格、特殊字符，示例路径：D:\ComfyUI；
进入解压目录，双击运行run_nvidia_gpu.bat启动程序；
命令行窗口出现Prompt Server started即代表启动成功；
打开浏览器，访问地址http://127.0.0.1:8188，进入 ComfyUI 网页端界面。

步骤 2：安装 ComfyUI-GGUF 插件

FLUX.1 GGUF 格式模型需要该插件加载，提供两种安装方式：

方式一：ComfyUI Manager 在线安装（推荐）

网页端右上角点击Manager，选择Custom Nodes Manager；
搜索框输入GGUF，找到ComfyUI-GGUF；
点击 Install 完成安装，安装结束后重启 ComfyUI。

方式二：手动离线安装（网络异常时使用）

进入目录ComfyUI\custom_nodes；
地址栏输入cmd唤起命令行，执行拉取命令：

bash

运行

git clone https://github.com/city96/ComfyUI-GGUF

若无 Git 环境，可下载插件 ZIP 压缩包，直接解压至custom_nodes文件夹；
重启 ComfyUI 使插件生效。

步骤 3：分类放置模型文件

按照规则将模型放入对应子目录，目录均位于 ComfyUI 根目录下：

FLUX.1 GGUF 主模型路径：models\unet选型参考：6GB 显存选 Q4、8GB 显存选 Q5、12GB 及以上显存选 Q8。
T5-XXL（GGUF）文本编码器路径：models\clip建议选择 Q5_K_M 及以上版本，保障文本解析效果。
CLIP-L 模型（clip_l.safetensors）路径：models\clip
VAE 模型（ae.safetensors）路径：models\vae，可重命名为flux_ae.safetensors方便区分。

步骤 4：搭建专属工作流

FLUX.1 不兼容传统 SD 工作流，需新增专用节点：

界面空白处双击，搜索并添加Unet Loader (GGUF)，加载已放入的 FLUX.1 主模型；
再次双击空白处，添加CLIP Loader (GGUF)，加载 T5-XXL 与 CLIP-L 模型，类型设置为flux；
添加VAE 加载器，选中对应的 VAE 模型；
补充两个 CLIP Text Encode（Prompt）节点（FLUX.1 不支持反向提示词，但节点必须保留，避免报错）；
将各加载器输出端与采样器对应端口依次连接；

快捷方案：可直接导入网络现成的 FLUX.1 GGUF 工作流 JSON 文件，省去手动连线操作。

步骤 5：图像生成测试

在提示词输入框填写画面描述，建议描述内容具体、层次清晰；
点击界面右下角Queue Prompt开始生成；
节点依次变绿代表对应步骤执行中，全部完成后图像自动输出；
生成文件默认保存至ComfyUI\output目录。

六、使用规范与参数建议

提示词规则：FLUX.1 不支持反向提示词，无需填写负面描述；内容描述越具体，生成结果越贴合预期；
分辨率适配：6GB 低显存设备优先使用 512×512 分辨率，降低显存占用；
后台设置：生成过程关闭其他高显存占用软件，避免显存溢出。

七、常见问题排查

问题：启动 / 生成时提示找不到模型排查：核对模型存放目录是否正确，检查文件路径、文件夹名称是否包含中文 / 空格。
问题：节点标红、功能报错排查：确认使用GGUF 专属加载节点，不可混用传统模型节点。
问题：生成速度过慢排查：低显存设备降低图像分辨率，或切换更低档位的量化模型。
问题：不同量化版本画质差异说明：常规场景下 Q4/Q5 版本肉眼差异较小；复杂画面、密集文字场景，高量化版本（Q6/Q8）细节表现更优。

八、补充总结

FLUX.1 GGUF 量化版有效降低了原模型的硬件门槛，让 6GB 及以上消费级显卡可以本地运行。该模型在语义理解、文字生成、人体结构方面相比传统 SD 系列有明显提升。

ComfyUI 部署 FLUX.1 GGUF 量化模型完整技术教程