【图像处理】基于离散余弦变换和小波变换的图像压缩附Matlab代码-编程实验室

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。

🍎 往期回顾关注个人主页：Matlab科研工作室

🍊个人信条：格物致知,完整Matlab代码及仿真咨询内容私信。

🔥内容介绍

在数字化时代，图像作为核心信息载体，其数据量的爆炸式增长对存储、传输及实时处理带来了巨大挑战。图像压缩技术通过剔除数据冗余（空域冗余、视觉冗余等），在保证视觉质量的前提下缩减数据量，成为图像处理领域的核心技术。离散余弦变换（DCT）与离散小波变换（DWT）作为两种经典的变换域压缩方法，分别凭借高效性和高保真特性，在不同场景中得到广泛应用。本文将深入剖析两种变换的原理、实现流程、性能差异及融合趋势，为图像压缩技术的应用与优化提供参考。

一、离散余弦变换（DCT）及其在图像压缩中的应用

1.1 DCT变换的核心原理

DCT是一种将信号从空域转换到频域的正交变换，由N. Ahmed等人于1974年提出，其核心优势在于能将图像能量集中于少数低频系数，且仅涉及实数运算，计算效率远高于傅里叶变换。其二维变换公式如下：

F(u,v) = C(u)C(v) * ∑ₓ=₀ⁿ⁻¹ ∑ᵧ=₀ᵐ⁻¹ f(x,y) * cos((2x+1)uπ/2N) * cos((2y+1)vπ/2M)

其中，f(x,y)为原始图像像素值，F(u,v)为变换后的频率系数，N、M为图像宽高，C(u)、C(v)为归一化常数因子。变换后，低频系数集中了图像70%以上的能量，对应图像整体轮廓；高频系数能量微弱，对应细节纹理，为压缩提供了冗余剔除基础。

1.2 基于DCT的图像压缩流程

DCT压缩的核心逻辑是对高频系数进行量化丢弃，典型流程（以JPEG标准为例）如下：

分块处理：将图像分割为8×8或16×16像素块，因小块变换计算量低、能量集中效果好，是JPEG标准的默认方案。
DCT变换：对每个像素块执行二维DCT变换，将空域像素值转换为频域系数矩阵，低频系数集中在矩阵左上角。
量化操作：基于人眼视觉特性设计量化表，对高频系数采用大步长量化（趋近于0），低频系数采用小步长量化（保留细节），实现冗余剔除。量化步长直接决定压缩比与图像质量，步长越大压缩比越高，但失真越明显。
熵编码：对量化后的系数进行Z字形扫描（按低频到高频顺序），将二维矩阵转为一维序列，再通过霍夫曼编码或算术编码压缩符号冗余，进一步缩减数据量。
解码恢复：经熵解码、逆量化、逆DCT变换及块拼接，重建图像。

1.3 性能评估与技术特性

DCT压缩性能通常采用峰值信噪比（PSNR）与压缩比衡量。PSNR计算公式为PSNR = 10 * log₁₀(MAX² / MSE)，其中MAX为像素最大值（通常255），MSE为重建图像与原始图像的均方误差，PSNR越高表示质量越好。实验表明，量化步长从1增至8时，压缩比从1.0提升至8.0，但PSNR从40.0dB降至10.0dB，需在质量与压缩比间权衡。

DCT的优势在于计算复杂度低、硬件实现简单，适配视频会议、网页图片等实时场景；局限性则十分显著：分块处理易导致低码率下出现块效应（块边界灰度突变），且对图像全局相关性利用不足，复杂纹理区域失真明显。

二、离散小波变换（DWT）及其在图像压缩中的应用

2.1 DWT变换的核心原理

为解决DCT时频局部化能力弱的缺陷，1980年代Morlet、Daubechies等人提出DWT，其基于多尺度分析思想，通过“滤波+下采样”操作将图像分解为不同频率子带，实现时域与频域的双重局部化。

二维DWT分解分为两步：先对图像每行执行一维DWT，通过低通滤波器（LPF）提取低频趋势、高通滤波器（HPF）提取高频细节，再对结果按列重复滤波操作，最终得到四个子带：低频近似子带（LL，能量集中区）、垂直边缘子带（LH）、水平边缘子带（HL）、对角纹理子带（HH）。对LL子带重复分解可实现多级多分辨率表示，分解级数越多，高频细节越精细，但计算量递增。

小波基的选择直接影响压缩性能，常用基函数包括Haar小波（计算快但平滑性差）、Daubechies小波（db4/db6，平衡平滑性与复杂度，应用最广）、双正交小波（支持无损压缩）。

2.2 基于DWT的图像压缩流程

DWT压缩依托子带能量差异实现冗余剔除，核心流程（以JPEG2000标准为例）如下：

预处理：调整图像尺寸为2的整数次幂（如256×256），通过零填充或裁剪避免分解失真；彩色图像需分离RGB通道，对各通道单独处理。
多级DWT分解：采用选定小波基执行2-3级分解，得到1个高频LL子带与3N个高频子带（N为分解级数），LL子带集中80%以上能量。
子带量化：对高频子带采用自适应阈值量化，优先剔除能量微弱的HH子带系数，对LH/HL子带（边缘信息）保留关键系数，减少视觉失真。
熵编码与传输：采用嵌入式块编码（EBCOT）对量化系数编码，支持渐进式传输——先传输LL子带（模糊图像），再补充高频子带（逐步清晰），适配不同带宽场景。

2.3 性能评估与技术特性

相较于DCT，DWT压缩具有三大核心优势：一是无块效应，全局多尺度分解避免了分块边界不连续，高压缩比下视觉质量更优，相同压缩比下PSNR比DCT高2-3dB；二是多分辨率表示能力，支持渐进式传输与可伸缩编码，适配医学影像、卫星遥感等高端场景；三是边缘保留性好，高频子带直接对应边缘纹理，自适应量化可减少细节丢失。

其局限性在于计算复杂度高，多级分解需大量滤波与下采样操作，硬件实现成本高于DCT，在实时性要求极高的场景（如移动端视频）应用受限。

三、DCT与DWT变换的核心差异及场景适配

DCT适用于实时性优先、对失真容忍度较高的场景，如网页图片（JPEG）、视频会议（H.264/HEVC）、移动端图像传输等，凭借低计算量实现高效压缩；DWT则适用于高保真需求场景，如医学影像（MRI/CT）、卫星遥感图像、数字图书馆（JPEG2000）等，在高压缩比下仍能保留关键细节，且支持无损压缩。

四、技术优化与融合趋势

4.1 单一变换的优化方向

DCT的优化聚焦于缓解块效应，现有方案包括自适应分块（根据纹理复杂度动态调整块大小）、基于人眼视觉特性的量化表优化、与CNN结合的残差编码等，可在保持实时性的同时提升图像质量。DWT的优化则侧重轻量化，通过简化小波基计算、多级分解自适应控制，降低硬件实现成本，适配边缘计算设备。

4.2 两种变换的融合应用

为兼顾实时性与高保真，近年来出现DCT与DWT融合的压缩方案：一种是分块小波变换，对图像分块后执行DWT，减少全局分解的计算量，同时避免块效应；另一种是混合变换编码，对DWT分解后的LL子带（低频区）执行DCT变换，进一步集中能量，提升压缩比。此外，随着AI编码技术的发展，DCT/DWT常作为特征提取模块与神经网络结合，构建端到端压缩模型，实现性能突破。

五、总结

离散余弦变换与离散小波变换作为图像压缩领域的两大核心技术，各有优劣：DCT以低复杂度奠定了传统图像编码的基础，适配海量实时场景；DWT凭借多尺度分析能力实现高保真压缩，推动了高端图像应用的发展。二者的技术特性决定了其场景适配差异，而优化与融合则成为未来发展的核心方向。随着硬件计算能力的提升与AI技术的渗透，基于DCT/DWT的混合编码方案将进一步突破性能瓶颈，在5G通信、远程医疗、智能监控等领域发挥更重要的作用。

⛳️ 运行结果

🔗 参考文献

[1] 李秀敏,万里青,周拥军.基于MATLAB的DCT变换在JPEG图像压缩中的应用[J].电光与控制, 2005, 12(2):4.DOI:10.3969/j.issn.1671-637X.2005.02.017.

[2] 李磊.基于MATLAB GUI的数字图像处理系统设计[D].成都理工大学[2026-01-26].DOI:CNKI:CDMD:2.1012.499902.

[3] 罗晨.基于DCT的图像压缩及MATLAB实现[J].电子设计工程, 2011, 19(18):3.DOI:10.3969/j.issn.1674-6236.2011.18.059.

📣 部分代码

🎈 部分理论引用网络文献，若有侵权联系博主删除

👇 关注我领取海量matlab电子书和数学建模资料

🏆团队擅长辅导定制多种科研领域MATLAB仿真，助力科研梦：

🌈 各类智能优化算法改进及应用

生产调度、经济调度、装配线调度、充电优化、车间调度、发车优化、水库调度、三维装箱、物流选址、货位优化、公交排班优化、充电桩布局优化、车间布局优化、集装箱船配载优化、水泵组合优化、解医疗资源分配优化、设施布局优化、可视域基站和无人机选址优化、背包问题、风电场布局、时隙分配优化、最佳分布式发电单元分配、多阶段管道维修、工厂-中心-需求点三级选址问题、应急生活物质配送中心选址、基站选址、道路灯柱布置、枢纽节点部署、输电线路台风监测装置、集装箱调度、机组优化、投资优化组合、云服务器组合优化、天线线性阵列分布优化、CVRP问题、VRPPD问题、多中心VRP问题、多层网络的VRP问题、多中心多车型的VRP问题、动态VRP问题、双层车辆路径规划（2E-VRP）、充电车辆路径规划（EVRP）、油电混合车辆路径规划、混合流水车间问题、订单拆分调度问题、公交车的调度排班优化问题、航班摆渡车辆调度问题、选址路径规划问题、港口调度、港口岸桥调度、停机位分配、机场航班调度、泄漏源定位

🌈 机器学习和深度学习时序、回归、分类、聚类和降维

2.1 bp时序、回归预测和分类

2.2 ENS声神经网络时序、回归预测和分类

2.3 SVM/CNN-SVM/LSSVM/RVM支持向量机系列时序、回归预测和分类

2.4 CNN|TCN|GCN卷积神经网络系列时序、回归预测和分类

2.5 ELM/KELM/RELM/DELM极限学习机系列时序、回归预测和分类

2.6 GRU/Bi-GRU/CNN-GRU/CNN-BiGRU门控神经网络时序、回归预测和分类

2.7 ELMAN递归神经网络时序、回归\预测和分类

2.8 LSTM/BiLSTM/CNN-LSTM/CNN-BiLSTM/长短记忆神经网络系列时序、回归预测和分类

2.9 RBF径向基神经网络时序、回归预测和分类

2.10 DBN深度置信网络时序、回归预测和分类

2.11 FNN模糊神经网络时序、回归预测

2.12 RF随机森林时序、回归预测和分类

2.13 BLS宽度学习时序、回归预测和分类

2.14 PNN脉冲神经网络分类

2.15 模糊小波神经网络预测和分类

2.16 时序、回归预测和分类

2.17 时序、回归预测预测和分类

2.18 XGBOOST集成学习时序、回归预测预测和分类

2.19 Transform各类组合时序、回归预测预测和分类

方向涵盖风电预测、光伏预测、电池寿命预测、辐射源识别、交通流预测、负荷预测、股价预测、PM2.5浓度预测、电池健康状态预测、用电量预测、水体光学参数反演、NLOS信号识别、地铁停车精准预测、变压器故障诊断

🌈图像处理方面

图像识别、图像分割、图像检测、图像隐藏、图像配准、图像拼接、图像融合、图像增强、图像压缩感知

🌈 路径规划方面

旅行商问题（TSP）、车辆路径问题（VRP、MVRP、CVRP、VRPTW等）、无人机三维路径规划、无人机协同、无人机编队、机器人路径规划、栅格地图路径规划、多式联运运输问题、充电车辆路径规划（EVRP）、双层车辆路径规划（2E-VRP）、油电混合车辆路径规划、船舶航迹规划、全路径规划规划、仓储巡逻

🌈 无人机应用方面

无人机路径规划、无人机控制、无人机编队、无人机协同、无人机任务分配、无人机安全通信轨迹在线优化、车辆协同无人机路径规划

🌈 通信方面

传感器部署优化、通信协议优化、路由优化、目标定位优化、Dv-Hop定位优化、Leach协议优化、WSN覆盖优化、组播优化、RSSI定位优化、水声通信、通信上传下载分配

🌈 信号处理方面

信号识别、信号加密、信号去噪、信号增强、雷达信号处理、信号水印嵌入提取、肌电信号、脑电信号、信号配时优化、心电信号、DOA估计、编码译码、变分模态分解、管道泄漏、滤波器、数字信号处理+传输+分析+去噪、数字信号调制、误码率、信号估计、DTMF、信号检测

🌈电力系统方面

微电网优化、无功优化、配电网重构、储能配置、有序充电、MPPT优化、家庭用电

🌈 元胞自动机方面

交通流人群疏散病毒扩散晶体生长金属腐蚀

🌈 雷达方面

卡尔曼滤波跟踪、航迹关联、航迹融合、SOC估计、阵列优化、NLOS识别

🌈 车间调度

零等待流水车间调度问题NWFSP、置换流水车间调度问题PFSP、混合流水车间调度问题HFSP、零空闲流水车间调度问题NIFSP、分布式置换流水车间调度问题 DPFSP、阻塞流水车间调度问题BFSP

👇