news 2026/5/1 9:33:38

哈夫曼树译码函数(Decoding) 该函数通过哈夫曼编码串和已构建的哈夫曼树,还原出原始字符序列

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
哈夫曼树译码函数(Decoding) 该函数通过哈夫曼编码串和已构建的哈夫曼树,还原出原始字符序列

一、哈夫曼树译码函数(Decoding)
该函数通过哈夫曼编码串和已构建的哈夫曼树,还原出原始字符序列。其核心逻辑如下:

  1. 初始状态:从哈夫曼树的根节点开始(在数组表示中,根节点下标通常为2*n - 1,其中n是叶子节点数量)。
  2. 遍历编码串
    • 对于编码串中的每一位:
      • 若为'0',则跳转到当前节点的左孩子;
      • 若为'1',则跳转到当前节点的右孩子。
  3. 判断是否到达叶子节点
    • 当前节点的左右孩子均为 0(或为空),说明是叶子节点;
    • 此时输出该节点所代表的字符;
    • 然后重新回到根节点,继续后续译码。
  4. 终止条件:编码串全部位处理完毕,译码结束。

示例代码(C语言风格结构体与数组实现):

#include<stdio.h>#include<string.h>#defineMAX_NODE100typedefstruct{charch;// 存储字符intweight;// 权重intparent,lchild,rchild;// 双亲、左孩子、右孩子下标}HTNode;voidHuffmanDecode(HTNode ht[],introot,char*code,intn){inti=0;intcurrent=root;intlen=strlen(code);while(i<len){if(code[i]=='0'){current=ht[current].lchild;// 走左子树}elseif(code[i]=='1'){current=ht[current].rchild;// 走右子树}// 判断是否为叶子节点(左右孩子都为0)if(ht[current].lchild==0&&ht[current].rchild==0){printf("%c",ht[current].ch);// 输出对应字符current=root;// 回到根节点}i++;}printf("\n");}

二、树的存储结构

  1. 双亲表示法

    • 使用结构数组存储每个节点,每个节点包含数据、权重、双亲下标、左右孩子下标等信息。
    • 优点:便于向上查找祖先节点,适合构造哈夫曼树;
    • 缺点:查找孩子节点效率低,需遍历整个数组。
  2. 孩子表示法

    • 每个节点保存一个链表或动态数组,记录所有孩子节点的下标或指针;
    • 适用于多叉树,如文件系统目录结构;
    • 查找孩子高效,但空间开销较大。
  3. 孩子兄弟表示法(左孩子-右兄弟表示法)

    • 每个节点包含两个指针:“第一个孩子” 和 “右兄弟”;
    • 可将任意树转化为二叉树形式进行存储和操作;
    • 特别适合递归遍历和森林转换为二叉树的应用场景。

这些存储方式广泛应用于数据压缩(如哈夫曼编码)、操作系统目录管理、编译器语法树构建等领域。
构建哈夫曼树并生成编码表是数据压缩中的核心步骤,主要包括两个阶段:建树编码生成。以下是详细过程与实现方法。


一、构建哈夫曼树(Huffman Tree)

基本思想:

采用贪心算法,每次从所有节点中选取权值最小的两个节点,合并成一个新的内部节点,其权值为两者之和,直到只剩一棵树。

步骤:
  1. 给定 n 个字符及其出现频率(或权重),每个字符作为叶子节点。
  2. 构造一个优先队列(最小堆),按权值排序。
  3. 重复以下操作 (n-1) 次:
    • 取出权值最小的两个节点 A 和 B;
    • 创建新节点 C,C 的权值 = A.权值 + B.权值;
    • 将 A 设为 C 的左孩子,B 为右孩子(或反之);
    • 将 C 插入优先队列。
  4. 最后剩下的节点即为哈夫曼树的根。
存储结构(双亲表示法数组):

使用结构体数组HTNode ht[2*n],索引从 1 开始:

typedefstruct{charch;// 字符intweight;// 权重intparent;// 双亲下标intlchild;// 左孩子下标intrchild;// 右孩子下标}HTNode;

初始化时,前 n 个节点为叶子节点(字符+权重),parent 初始为 0;后续 n-1 个节点用于存储合并后的非叶节点。

示例代码(C语言风格):
voidCreateHuffmanTree(HTNode ht[],intn){intm=2*n-1;for(inti=1;i<=m;i++){ht[i].parent=ht[i].lchild=ht[i].rchild=0;}for(intk=n+1;k<=m;k++){intmin1=9999,min2=9999;intx1=0,x2=0;// 找两个无父节点且权值最小的节点for(intj=1;j<k;j++){if(ht[j].parent==0&&ht[j].weight<min1){min2=min1;x2=x1;min1=ht[j].weight;x1=j;}elseif(ht[j].parent==0&&ht[j].weight<min2){min2=ht[j].weight;x2=j;}}// 合并两个节点ht[k].weight=min1+min2;ht[k].lchild=x1;ht[k].rchild=x2;ht[x1].parent=k;ht[x2].parent=k;}}

二、生成哈夫曼编码表

原理:

从每个叶子节点出发,逆向回溯到根节点,路径上每一步:

  • 走左分支记为'0'
  • 走右分支记为'1'
    由于是从下往上生成,需将结果反转得到正确编码。
方法:逐个叶子节点遍历
#include<string.h>voidGenerateHuffmanCode(HTNode ht[],charhcode[][20],intn){chartemp[20];inttop=0;for(inti=1;i<=n;i++){intcurrent=i;intparent=ht[i].parent;top=0;// 从叶子向上遍历至根while(parent!=0){if(ht[parent].lchild==current)temp[top++]='0';elsetemp[top++]='1';current=parent;parent=ht[parent].parent;}// 反转字符串并存入编码表temp[top]='\0';for(intj=0;j<top;j++){hcode[i][j]=temp[top-1-j];}hcode[i][top]='\0';}}
编码表示方式:

使用二维字符数组hcode[i][20]存储第 i 个字符的哈夫曼编码。


完整流程示例(以字符频率 {‘A’:5, ‘B’:9, ‘C’:12, ‘D’:13, ‘E’:16, ‘F’:45} 为例)

字符频率哈夫曼编码
A51100
B91101
C12111
D13100
E16101
F450

注意:编码不唯一(左右子树可互换),但总带权路径长度 WPL 是最优的。


版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/29 15:59:45

‌如何应对生成式AI的测试挑战?

生成式AI在测试中的崛起与挑战概览‌ 生成式AI&#xff08;Generative AI&#xff09;通过大语言模型&#xff08;如GPT-4、Claude等&#xff09;和图像生成工具&#xff0c;正重塑软件测试格局。2025年&#xff0c;全球70%的测试团队已集成AI生成用例、自动化脚本或缺陷预测&…

作者头像 李华
网站建设 2026/4/23 10:29:08

03.闭包和内存泄漏

让人迷惑的闭包 闭包是 JavaScript 中一个非常容易让人迷惑的知识点对于那些有一点 JavaScript 使用经验但从未真正理解闭包概念的人来说&#xff0c;理解闭包可以看作是某种意义上的重生&#xff0c;但是需要付出非常多的努力和牺牲才能理解这个概念。回忆我前几年的时光&…

作者头像 李华
网站建设 2026/4/28 20:32:50

vue springboot基于Web的农产品溯源销售安全追溯 _azx2y

目录具体实现截图项目介绍论文大纲核心代码部分展示可定制开发之亮点部门介绍结论源码获取详细视频演示 &#xff1a;文章底部获取博主联系方式&#xff01;同行可合作具体实现截图 本系统&#xff08;程序源码数据库调试部署讲解&#xff09;同时还支持Python(flask,django)、…

作者头像 李华
网站建设 2026/4/28 20:44:20

基于小程序的太平镇农产品供销服务系统的设计与实现

目录具体实现截图项目介绍论文大纲核心代码部分展示可定制开发之亮点部门介绍结论源码获取详细视频演示 &#xff1a;文章底部获取博主联系方式&#xff01;同行可合作具体实现截图 本系统&#xff08;程序源码数据库调试部署讲解&#xff09;同时还支持Python(flask,django)、…

作者头像 李华
网站建设 2026/4/18 15:21:41

【R语言变量重要性评估实战】:掌握5大工具提升模型解释力

第一章&#xff1a;R语言变量重要性评估概述在构建机器学习模型或统计模型时&#xff0c;识别哪些变量对预测结果具有显著影响是关键步骤之一。变量重要性评估不仅有助于提升模型的可解释性&#xff0c;还能优化特征选择过程&#xff0c;减少过拟合风险并提高计算效率。R语言提…

作者头像 李华