news 2026/6/15 21:09:37

信息论与编码篇---各种熵之间的关系

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
信息论与编码篇---各种熵之间的关系

我们可以从“混乱程度”这个最直观的角度来理解各种熵的关系。

想象你的房间:

  • 非常整洁:书在书架,衣服在衣柜 ——熵很低

  • 非常混乱:书在地上,衣服在椅子上,袜子在床上 ——熵很高

熵,就是衡量这种“混乱程度”或“不确定性”的指标。


1. 信息熵:一切的起点

这是最核心、最基本的熵。它衡量的是“一件事结果有多难猜”

  • 例子A:抛一枚硬币。正反各50%。你猜中的概率是50%,结果有点不确定。信息熵 = 1比特

  • 例子B:从一副扑克牌里抽一张大王。概率只有1/54,基本猜不中。信息熵很高

  • 例子C:太阳从东边升起。100%确定。信息熵 = 0

通俗理解:信息熵就是“这件事的平均惊讶程度”。越不可能发生的事,发生了越惊讶,信息熵越高。


2. 交叉熵:用你的思路去猜别人的结果

假设你和朋友都看着同一堆东西,但你们手里的概率表不一样。

  • 真实情况:明天80%下雨,20%晴天。(这是真实分布P)

  • 你的猜测:你以为50%下雨,50%晴天。(这是猜测分布Q)

交叉熵就是“用你的概率表去猜真实结果时,你平均有多惊讶”

  • 如果明天真的下雨了(概率80%),你只有50%的把握,你会比较惊讶。

  • 如果明天晴天(概率20%),你有50%的把握,惊讶程度一般。

通俗理解:交叉熵 =你用错的剧本去猜结局,结果被真相打脸的次数。你的猜测越离谱,交叉熵越大。

关系:交叉熵 ≥ 信息熵。等号成立,当且仅当你的猜测完全等于真实情况(P=Q)。


3. 相对熵:你的思路到底错在哪

相对熵也叫KL散度。它不是直接衡量混乱,而是衡量两个概率分布之间的“差异”

通俗理解:相对熵 =交叉熵 - 信息熵

用刚才的例子:

  • 信息熵(真实世界的混乱度)= 0.72比特(由80%下雨、20%晴天算出来的)。

  • 交叉熵(用你的错误猜测去猜)= 1比特(由50%下雨、50%晴天猜80%下雨算出来的)。

  • 相对熵 = 1 - 0.72 = 0.28比特。

这个0.28比特,就是你因为“猜错概率”而额外付出的惊讶成本

关系:相对熵(KL散度)= 交叉熵 - 信息熵。


4. 联合熵:两个房间一起算

如果你有两个房间,一个卧室一个客厅。

  • 信息熵:只看卧室的混乱程度。

  • 联合熵把卧室和客厅加起来,算整个家的混乱程度

通俗理解:你妈检查卫生。原来只查你卧室,现在查全屋。全屋越乱,联合熵越大。

关系:联合熵 ≥ 单个熵。因为你多考虑了另一个变量。


5. 条件熵:已知一个房间,另一个有多乱

通俗理解如果你知道客厅已经乱成狗窝了,那卧室还会乱到什么程度?

条件熵就是在已知一个变量的情况下,另一个变量还剩多少不确定性

关系:联合熵 = 条件熵 + 已知那个变量的熵。


6. 互信息:两个房间有多像

通俗理解你妈发现,每次客厅乱的时候,卧室也一定乱。这说明客厅的乱和卧室的乱之间有很强的关联。

互信息就是衡量两个变量之间共享的信息量

关系

  • 互信息 = 信息熵 - 条件熵。

  • 如果两个房间完全独立(客厅乱不影响卧室),互信息 = 0。

  • 如果两个房间完全同步(客厅乱卧室必乱),互信息 = 卧室的信息熵。


一张图总结所有关系

如果把信息熵比作一个人的全部资产,那么:

  • 联合熵= 两个人的总资产

  • 条件熵= 知道对方有多少钱后,你还有多少钱

  • 互信息= 你们俩共同持有的联名账户

  • 交叉熵= 你以为对方很有钱,结果他其实没钱——你的预期偏差

  • 相对熵= 交叉熵 - 信息熵 = 你的预期偏差具体有多大

最核心的一句话

信息熵是你自己的混乱程度;
交叉熵是你猜别人时的混乱程度;
相对熵是你猜别人时多出来的混乱程度。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 11:29:21

学术AI工具盘点:10个论文写作网站详解

在学术生涯中,毕业论文写作往往成为大专、本科乃至硕博研究生的关键挑战,尤其是繁琐的文献梳理和内容创作过程常耗费大量精力。随着人工智能技术的发展,各类AI工具的出现显著提升了学术写作的效率与质量。以aibiye和aicheck为代表的专业化AI写…

作者头像 李华
网站建设 2026/6/15 11:30:38

2025年Agent概念落地,2026年智能体生产力基础设施:如何规模化部署Agent?收藏这份学习指南!

本文探讨了Agent智能体在2025年概念的扎根和开源生态的爆发,以及模型在真实工作能力上的进步和专用化趋势。文章重点分析了企业从一次性Agent实验转向大规模运行所面临的关键问题,并提出了企业级Agent栈的五大层(上下文、模型、编排、安全、交…

作者头像 李华
网站建设 2026/6/15 11:28:09

Flask-Migrate深度详解

1. 他是什么Flask-Migrate 是一个给 Flask 应用做数据库版本控制的工具。它相当于给数据库的每次改动拍了一张快照,并且能随时退回到任意一张快照的状态。想象你在装修厨房:今天装水槽、明天改电路、后天换橱柜。Flask-Migrate 就像一本装修日记&#xf…

作者头像 李华
网站建设 2026/6/15 11:29:40

如何理解词嵌入的维度?维度越大越好吗?

在学习自然语言处理(NLP)时,很多人都会遇到一个问题: 词嵌入的维度到底是什么意思? 为什么有的模型用 100 维,有的用 300 维,而 BERT 却是 768 维? 维度越大越好吗? 每…

作者头像 李华