GPEN+Gradio快速搭建Web界面：在线修图工具开发教程-编程实验室

GPEN+Gradio快速搭建Web界面：在线修图工具开发教程

1. 镜像环境说明

本镜像基于GPEN人像修复增强模型构建，预装了完整的深度学习开发环境，集成了推理及评估所需的所有依赖，开箱即用。适用于人脸超分、老照片修复、低质量图像增强等场景，特别适合需要快速部署和测试的开发者。

组件	版本
核心框架	PyTorch 2.5.0
CUDA 版本	12.4
Python 版本	3.11
推理代码位置	`/root/GPEN`

主要依赖库：-facexlib: 用于人脸检测与对齐 -basicsr: 基础超分框架支持 -opencv-python,numpy<2.0,datasets==2.21.0,pyarrow==12.0.1-sortedcontainers,addict,yapf

该环境已配置好所有必要组件，用户无需手动安装依赖即可直接运行推理或进行二次开发。

2. 快速上手

2.1 激活环境

在使用前，请先激活预设的 Conda 环境：

conda activate torch25

此环境包含 PyTorch 2.5.0 及相关 CUDA 支持，确保 GPU 加速推理正常运行。

2.2 模型推理 (Inference)

进入项目主目录并执行推理脚本：

cd /root/GPEN

场景 1：运行默认测试图

python inference_gpen.py

该命令将处理内置测试图像Solvay_conference_1927.jpg，输出结果为output_Solvay_conference_1927.png。

场景 2：修复自定义图片

python inference_gpen.py --input ./my_photo.jpg

替换my_photo.jpg为你的输入路径，输出文件将自动命名为output_my_photo.jpg。

场景 3：指定输入输出文件名

python inference_gpen.py -i test.jpg -o custom_name.png

通过-i和-o参数可灵活控制输入输出路径。

注意：所有推理结果将保存在项目根目录下，建议提前确认图片路径权限。

3. 已包含权重文件

为保障离线可用性和启动效率，镜像中已预下载并缓存以下关键模型权重：

ModelScope 缓存路径：~/.cache/modelscope/hub/iic/cv_gpen_image-portrait-enhancement
包含内容：
预训练生成器（Generator）
人脸检测器（Face Detection Model）
人脸对齐模块（Face Alignment Model）

若首次运行未找到本地权重，系统会自动从 ModelScope 下载至上述路径。后续调用无需重复下载，提升部署效率。

4. 使用 Gradio 构建 Web 交互界面

虽然原生脚本支持命令行推理，但为了实现更友好的用户体验，我们推荐使用 Gradio 快速构建一个可视化 Web 应用，让用户上传图片并实时查看修复效果。

4.1 安装 Gradio

确保当前环境中安装了 Gradio：

pip install gradio

4.2 编写 Web 接口代码

创建一个新的 Python 文件app.py，内容如下：

import os import cv2 import numpy as np import gradio as gr from basicsr.utils import img2tensor, tensor2img from facexlib.utils.face_restoration_helper import FaceRestoreHelper from GPEN_model import GPENModel # 假设模型类位于此处 # 初始化模型 def load_model(): model = GPENModel() face_helper = FaceRestoreHelper( upscale_factor=2, face_size=512, crop_ratio=(1, 1), det_model='retinaface_resnet50', save_ext='png', use_parse=True ) return model, face_helper model, face_helper = load_model() def enhance_image(input_img): """接收输入图像，返回修复后的图像""" if input_img is None: return None # 转换为 RGB（Gradio 输出为 BGR） bgr_input = cv2.cvtColor(np.array(input_img), cv2.COLOR_RGB2BGR) # 预处理 face_helper.clean_all() face_helper.read_image(bgr_input) face_helper.get_face_landmarks_5(only_center_face=True) face_helper.align_warp_face() # 单张人脸处理 for cropped_face in face_helper.cropped_faces: # 转为张量 cropped_tensor = img2tensor(cropped_face / 255., bgr2rgb=True, float32=True) normalized = (cropped_tensor - 0.5) * 2 restored_face = model.enhance(normalized.unsqueeze(0))[0] # 反归一化 & 转回图像 restored_face = (restored_face.clamp(-1, 1) + 1) / 2 restored_face = tensor2img(restored_face, rgb2bgr=True, min_max=(0, 1)) # 后处理融合 restored_face = np.clip(restored_face, 0, 255).astype('uint8') face_helper.add_restored_face(restored_face) # 合成最终图像 face_helper.get_inverse_affine(None) output = face_helper.paste_faces_to_input_image() output_rgb = cv2.cvtColor(output, cv2.COLOR_BGR2RGB) return output_rgb # 构建 Gradio 界面 with gr.Blocks(title="GPEN 在线人像修复") as demo: gr.Markdown("# 🖼️ GPEN 人像修复增强工具") gr.Markdown("上传一张模糊或低质的人脸照片，体验高质量修复效果！") with gr.Row(): with gr.Column(): input_image = gr.Image(type="pil", label="原始图像") submit_btn = gr.Button("开始修复", variant="primary") with gr.Column(): output_image = gr.Image(type="numpy", label="修复结果") examples = gr.Examples( examples=[ "./test_images/old_photo_1.jpg", "./test_images/lowres_face.png" ], inputs=input_image ) submit_btn.click(fn=enhance_image, inputs=input_image, outputs=output_image) # 启动服务 if __name__ == "__main__": demo.launch(server_name="0.0.0.0", server_port=7860, share=True)

说明：以上代码假设GPENModel类已封装好推理逻辑。如需适配原始仓库结构，可参考其inference_gpen.py中的模型加载方式。

4.3 运行 Web 应用

保存后执行：

python app.py

应用将在http://0.0.0.0:7860启动，并可通过内网穿透或公网 IP 访问。share=True参数可生成临时外网链接（基于 Gradio Tunnel）。

5. 实践优化建议

5.1 性能调优

批量处理：若需支持多图并发，建议启用batch_size > 1并合理设置显存占用。
分辨率选择：优先使用512x512输入尺寸，过高分辨率可能导致 OOM。
缓存机制：对于频繁访问的用户，可在前端加入结果缓存策略。

5.2 用户体验改进

添加进度条反馈（Gradiogr.Progress()）
支持拖拽上传、裁剪预览
输出对比图（side-by-side before/after）

示例对比展示代码片段：

with gr.Row(): gr.Image(value="input.jpg", label="原始图像") gr.Image(value="output.jpg", label="修复结果")

5.3 安全与部署

关闭share=True生产环境暴露风险
使用 Nginx + Gunicorn + HTTPS 进行生产级部署
对上传文件做类型校验（.jpg,.png），防止恶意注入

6. 常见问题

数据集准备：官方训练基于 FFHQ 数据集。由于 GPEN 采用监督学习范式，需准备高质量-低质量图像对。推荐使用 RealESRGAN 或 BSRGAN 对高清图像降质生成低质样本。
训练流程：提供训练数据路径后，设置目标分辨率（建议 512x512）、调整生成器与判别器学习率（初始值1e-4）、设定总 epoch 数（通常 100~200），即可开始训练。
显存不足：若出现 CUDA Out of Memory，尝试降低 batch size 至 1 或启用梯度检查点（gradient checkpointing）。
人脸错位：确保facexlib正确安装且检测模型加载成功；可尝试更换det_model参数。

7. 参考资料

官方 GitHub 仓库：yangxy/GPEN
ModelScope 模型页面：iic/cv_gpen_image-portrait-enhancement
Gradio 官方文档：https://www.gradio.app/docs

8. 引用 (Citation)

@inproceedings{yang2021gpen, title={GAN-Prior Based Null-Space Learning for Consistent Super-Resolution}, author={Yang, Tao and Ren, Peiran and Xie, Xuansong and Zhang, Lei}, booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)}, year={2021} }