如何评估GPEN修复质量？PSNR/SSIM指标计算教程-编程实验室

如何评估GPEN修复质量？PSNR/SSIM指标计算教程

GPEN人像修复增强模型镜像为用户提供了一套完整的开箱即用解决方案，不仅支持高效的人脸超分与画质增强推理，还集成了评估模块所需的全部依赖。在实际应用中，仅凭肉眼观察难以客观判断修复效果的好坏，尤其是在对比不同参数设置或模型版本时，我们需要借助量化指标来衡量输出图像的质量。

本文将带你从零开始，在该镜像环境中实现对GPEN修复结果的PSNR（峰值信噪比）和SSIM（结构相似性）指标计算，帮助你科学、准确地评估人像修复质量。

1. 镜像环境说明

组件	版本
核心框架	PyTorch 2.5.0
CUDA 版本	12.4
Python 版本	3.11
推理代码位置	`/root/GPEN`

主要依赖库：

facexlib: 用于人脸检测与对齐
basicsr: 基础超分框架支持
opencv-python,numpy<2.0,datasets==2.21.0,pyarrow==12.0.1
sortedcontainers,addict,yapf

这些库中，basicsr是关键组件，它内置了 PSNR 和 SSIM 的计算函数，无需手动实现即可调用，极大简化了评估流程。

2. 快速上手

2.1 激活环境

首先确保进入正确的 Conda 环境：

conda activate torch25

2.2 模型推理 (Inference)

进入 GPEN 项目目录并运行推理脚本：

cd /root/GPEN

你可以选择以下几种方式测试：

# 场景 1：运行默认测试图 python inference_gpen.py # 场景 2：修复自定义图片 python inference_gpen.py --input ./my_photo.jpg # 场景 3：指定输入输出文件名 python inference_gpen.py -i test.jpg -o custom_name.png

推理完成后，生成的高清修复图像会保存在当前目录下，如output_Solvay_conference_1927.png。接下来我们将使用原始低清图像和修复后的高清图像进行质量评估。

3. 准备评估数据对

要计算 PSNR 和 SSIM，必须有一组“真实图像”（Ground Truth）和对应的“生成图像”（Generated Image）。对于 GPEN 这类超分辨率模型来说，理想情况是：

真实图像（HR）：高分辨率、高质量的人脸图像
退化图像（LR）：通过模糊、下采样等方式生成的低质量图像
修复图像（SR）：由 GPEN 对 LR 图像修复后得到的结果

然后我们比较SR 与 HR的差异，从而评估修复性能。

3.1 构建测试样本对

假设你想评估模型在某个特定图像上的表现，可以按如下步骤准备：

找一张清晰的原始人脸图，命名为hr_image.png
使用 OpenCV 或 PIL 对其进行降质处理，生成对应的lr_image.png
用 GPEN 对lr_image.png进行修复，得到sr_image.png

示例降质代码（可保存为degrade.py）：

import cv2 import numpy as np def downsample_blur(image_path, scale=4): img = cv2.imread(image_path) h, w = img.shape[:2] # 下采样 + 上采样模拟模糊 small = cv2.resize(img, (w // scale, h // scale), interpolation=cv2.INTER_LINEAR) lr_img = cv2.resize(small, (w, h), interpolation=cv2.INTER_LINEAR) return img, lr_img # 示例：生成一对 HR 和 LR 图像 hr, lr = downsample_blur("original_face.jpg") cv2.imwrite("hr_image.png", hr) cv2.imwrite("lr_image.png", lr)

再运行推理生成 SR 图像：

python inference_gpen.py -i lr_image.png -o sr_image.png

现在你就有了完整的三元组：hr_image.png,lr_image.png,sr_image.png。

4. 计算 PSNR 与 SSIM 指标

4.1 使用 basicsr 内置工具计算

basicsr提供了方便的图像质量评估接口，位于basicsr.metrics模块中。

创建一个评估脚本evaluate.py：

import cv2 import numpy as np from basicsr.metrics import calculate_psnr, calculate_ssim def read_image(path): img = cv2.imread(path) if img is None: raise FileNotFoundError(f"无法加载图像: {path}") return img # 读取图像 hr_img = read_image('hr_image.png') sr_img = read_image('sr_image.png') # 注意：PSNR/SSIM 通常在 Y 通道（亮度）上计算，尤其是针对 YCbCr 色彩空间 def bgr2ycbcr(img, only_y=True): """将 BGR 图像转换为 YCbCr""" yuv = cv2.cvtColor(img, cv2.COLOR_BGR2YUV) if only_y: return yuv[:, :, 0] return yuv # 转换为 Y 通道 hr_gray = bgr2ycbcr(hr_img, only_y=True).astype(np.float32) sr_gray = bgr2ycbcr(sr_img, only_y=True).astype(np.float32) # 计算 PSNR psnr_value = calculate_psnr(sr_gray, hr_gray, crop_border=4) # 计算 SSIM（注意传入的是原始BGR图像，内部会自动转灰度） ssim_value = calculate_ssim(sr_img, hr_img, crop_border=4, input_order='HWC', test_y_channel=True) print(f"PSNR: {psnr_value:.4f} dB") print(f"SSIM: {ssim_value:.4f}")

说明：
crop_border=4表示裁剪边缘像素，避免边界效应影响评估。
test_y_channel=True表示只在亮度通道上计算，这是图像超分领域的标准做法。

执行脚本：

python evaluate.py

输出示例：

PSNR: 28.6732 dB SSIM: 0.8912

数值越高表示修复效果越好。一般来说：

PSNR > 25 dB 可接受，> 30 dB 表现优秀
SSIM > 0.8 表示结构保持良好，接近 1 则非常接近原图

4.2 批量评估多个图像

如果你有多个测试图像，可以扩展脚本进行批量评估。

新建batch_evaluate.py：

import os import cv2 import numpy as np from basicsr.metrics import calculate_psnr, calculate_ssim def bgr2ycbcr(img, only_y=True): yuv = cv2.cvtColor(img, cv2.COLOR_BGR2YUV) if only_y: return yuv[:, :, 0] return yuv def evaluate_folder(hr_dir, sr_dir): psnr_list = [] ssim_list = [] for filename in sorted(os.listdir(hr_dir)): if not filename.lower().endswith(('.png', '.jpg', '.jpeg')): continue hr_path = os.path.join(hr_dir, filename) sr_path = os.path.join(sr_dir, filename) hr_img = cv2.imread(hr_path) sr_img = cv2.imread(sr_path) if hr_img is None or sr_img is None: print(f"跳过缺失文件: {filename}") continue # 转换为 Y 通道用于 PSNR hr_gray = bgr2ycbcr(hr_img, only_y=True).astype(np.float32) sr_gray = bgr2ycbcr(sr_img, only_y=True).astype(np.float32) psnr_val = calculate_psnr(sr_gray, hr_gray, crop_border=4) ssim_val = calculate_ssim(sr_img, hr_img, crop_border=4, input_order='HWC', test_y_channel=True) psnr_list.append(psnr_val) ssim_list.append(ssim_val) print(f"{filename}: PSNR={psnr_val:.4f}, SSIM={ssim_val:.4f}") avg_psnr = np.mean(psnr_list) avg_ssim = np.mean(ssim_list) print(f"\n平均 PSNR: {avg_psnr:.4f} dB") print(f"平均 SSIM: {avg_ssim:.4f}") # 使用示例 evaluate_folder('test_hr/', 'test_sr/')

将你的高质图像放入test_hr/，修复后图像放入test_sr/，即可一键获得整体性能报告。

5. 指标解读与使用建议

5.1 PSNR 解读

PSNR 是基于均方误差（MSE）的对数形式，反映两个图像之间的像素级差异。

优点：计算简单、广泛使用
缺点：不完全符合人类视觉感知，有时高 PSNR 并不代表更“自然”

例如，过度平滑的图像可能 MSE 很小，PSNR 高，但缺乏细节。

5.2 SSIM 解读

SSIM 关注亮度、对比度和结构信息的相似性，更贴近人眼判断。

优点：更能反映图像的结构性保留程度
缺点：对轻微偏色或局部失真不够敏感

5.3 实际使用建议

场景	推荐做法
快速验证单张效果	直接运行`evaluate.py`查看 PSNR/SSIM
模型调参对比	批量测试多组参数下的平均指标，选出最优配置
发布论文或报告	同时列出 PSNR 和 SSIM，并附可视化对比图
线上服务监控	设置 PSNR 阈值（如 <25dB）触发告警，提示修复失败