news 2026/6/15 19:26:44

10.3 反向传播算法:计算图、链式法则与自动微分

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
10.3 反向传播算法:计算图、链式法则与自动微分

10.3 反向传播算法:计算图、链式法则与自动微分

反向传播算法是训练多层神经网络的核心,它通过高效地计算损失函数相对于网络所有参数的梯度,为基于梯度的优化方法提供了可能。反向传播并非一种新的学习算法,而是梯度计算在神经网络特定结构下的高效实现方案。其核心思想源于微积分中的链式法则,并通过计算图这一抽象得到直观的表示和系统化的实现。本节将详细阐述反向传播的原理,从计算图表示、链式法则的递归应用,到其与现代自动微分技术的紧密联系。

10.3.1 计算图:结构与抽象

计算图是一种用于描述数学运算的有向无环图。在深度学习的语境下,它将复杂的神经网络前向传播过程分解为一系列基本的原子操作(如加法、乘法、指数运算、矩阵乘、激活函数等),从而清晰地揭示出变量之间的依赖关系。

10.3.1.1 图的构成

一个计算图GGG包含两种类型的节点:

  • 变量节点:表示计算过程中的数据,包括输入数据、模型参数(权重、偏置)以及计算得到的中间变量。
  • 运算符节点:表示施加在变量上的基本运算。每个运算符节点接收一个或多个输入变量,并产生一个输出变量。

图中的边表示数据的流向,从输入指向运算符,再从运算符指向其输出的变量。例如,一个简单的线性层运算z=wTx+bz = \mathbf{w}^T \mathbf{x} + bz=wTx+b可以分解为向量内积和标量加法两个运算符节点。

10.3.1.2 前向传播与反向传播的图视角

神经网络的前向传播过程,对应于从输入节点开始,按照图的拓扑顺序,依次计算每个运算符节点的输出,直至得到最终的输出(如预测值)和损失值LLL。这完成了计算图的“向前”遍历。

反向传播的目标是计算损失LLL对图中所有参数节点(如w\mathbf{w}w,bbb)的梯度∂L∂w,∂L∂b\frac{\partial L}{\partial \mathbf{w}}, \frac{\partial L}{\partial b}wL,bL。从计算图的角度看,这等价于从损失节点LLL开始,按照与边相反的方向(即逆向拓扑顺序),依次计算LLL对图中每个节点的梯度。计算图的结构化表示使得梯度计算可以分解为一系列局部梯度传播的步骤。

10.3.2 链式法则与反向传播的递归计算

反向传播算法的数学本质是多变量微积分的链式法则。对于一个由多个函数嵌套组成的复合函数,链式法则说明了如何计算其导数。在计算图中,每个运算符节点代表一个局部函数。

10.3.2.1 链式法则的形式化

设最终损失LLL是变量yyy的函数,而yyy又是变量xxx的函数:y=f(x)y = f(x)y=f(x),L=g(y)L = g(y)L=g(y)。根据链式法则,LLLxxx的导数为:
∂L∂x=∂L∂y⋅∂y∂x \frac{\partial L}{\partial x} = \frac{\partial L}{\partial y} \cdot \frac{\partial y}{\partial x}xL=yLxy

在计算图中,节点yyyxxx的后继。当我们进行反向传播时,假设已经计算得到了损失LLLyyy的梯度∂L∂y\frac{\partial L}{\partial y}yL(称为yyy的“上游梯度”),那么要计算LLLxxx的梯度,只需将上游梯度乘以yyy关于

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 13:10:17

电路考研必看:戴维南定理3步速解法与真题精讲

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 制作考研电路专题训练系统,功能:1. 分类整理近10年考研戴维南定理真题 2. 开发智能解题引导功能 3. 典型错误模式分析 4. 自适应难度练习题生成 5. 解题时间…

作者头像 李华
网站建设 2026/6/15 15:15:07

告别Docker权限问题:5种高效解决方案对比

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个Docker权限问题解决效率对比工具,能够:1) 自动测试不同解决方案(如sudo、用户组添加、修改socket权限等)的执行效率,2) 评估每种方案的…

作者头像 李华
网站建设 2026/6/15 13:53:11

Open-AutoGLM生态闭环成型:企业级落地仅剩这2个关键步骤

第一章:Open-AutoGLM 开源生态最新进展 Open-AutoGLM 作为新一代开源大语言模型框架,近期在社区贡献、工具链完善和多模态支持方面取得了显著进展。项目核心团队宣布正式合并了来自全球开发者的超过 120 个 Pull Requests,涵盖性能优化、API …

作者头像 李华
网站建设 2026/6/15 15:18:15

吉时利2000六位半万用表 keithley2000

keithley2000六位半万用表是吉时利的高性能dmm系列的一款。基于与2001和2002款相同的高速、低噪音A/D转换器技术,2000是一种快速、准确、高度稳定的仪器,易于操作方便。它结合了广泛的测量范围和优越的精度规范——从100nV到1天的直流电压kV(…

作者头像 李华
网站建设 2026/6/15 13:11:16

AI一键搞定Playwright安装:告别复杂配置

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 请生成一个完整的Playwright安装配置脚本,要求:1.支持Python环境 2.自动下载Chromium、Firefox和WebKit浏览器驱动 3.设置必要的环境变量 4.包含安装验证测…

作者头像 李华