news 2026/6/15 13:56:30

初探Langevin dynamics(朗之万动力学)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
初探Langevin dynamics(朗之万动力学)

文章目录

    • 一、直觉理解:
    • 二、连续形式(SDE 视角)
    • 三、为什么它能「采样」?
    • 四、离散形式(算法角度)
    • 五、和机器学习的对应关系
      • 5.1 Langevin MCMC
      • 5.2 SGLD(Stochastic Gradient Langevin Dynamics)
    • 六、和 Diffusion Model 的关系
      • 6.1 反向扩散 = Langevin-like dynamics
      • 5.2 Score matching = 学梯度
    • 七、和 Tweedie Estimator[^1] 的桥梁
    • 八、总结
    • 参考

一、直觉理解:

Langevin dynamics =「有噪声的梯度下降」

想象一个小球在能量地形U ( x U(xU(x) 上滚动:

  • 梯度项
    小球会沿着「能量下降最快的方向」滚
    ⇒ \Rightarrow普通梯度下降

  • 随机噪声项
    环境温度导致的小抖动
    ⇒ \Rightarrow帮助跳出局部极小值

👉 所以:

Langevin dynamics = 梯度下降 + 随机热噪声

朗之万动力学通过两个关键力的博弈实现系统调控:摩擦力像水中的阻力让粒子减速,随机力模拟分子碰撞带来的无规则扰动。当这两种力达到平衡时,系统会自然趋向玻尔兹曼分布——这正是复杂概率采样的物理基础。

二、连续形式(SDE 视角)

标准的过阻尼 Langevin SDE

d x t = − ∇ U ( x t ) d t + 2 T d W t \boxed{ \mathrm{d}x_t = - \nabla U(x_t)\mathrm{d}t + \sqrt{2T}\mathrm{d}W_t }dxt=U(xt)dt+2TdWt

各项含义

含义
x t x_txt系统状态(参数、样本、粒子位置)
U ( x U(xU(x)势能函数(能量)
− ∇ U ( x -\nabla U(xU(x)确定性“往低能走”
W t W_tWtWiener 过程(布朗运动)
T TT温度(噪声强度)

三、为什么它能「采样」?

这是Langevin dynamics 的核心魔法

如果你让上面的 SDE 跑足够久,它的稳态分布是:

p ( x ) ∝ e − U ( x ) / T \boxed{ p(x) \propto e^{-U(x)/T} }p(x)eU(x)/T

这就是Boltzmann 分布

换句话说

  • 你不需要知道如何直接采样p ( x p(xp(x)
  • 只要能算∇ U ( x \nabla U(xU(x)
  • 就可以用 Langevin dynamics 从p ( x p(xp(x) 中采样

四、离散形式(算法角度)

Euler–Maruyama 离散化:

x k + 1 = x k + η ∇ U ( x k ) − 2 T η ϵ k , ϵ k ∼ N ( 0 , I ) \boxed{ x_{k+1} = x_k + \eta \nabla U(x_k) - \sqrt{2T\eta}\epsilon_k, \quad \epsilon_k \sim \mathcal{N}(0,I) }xk+1=xk+ηU(xk)2Tηϵk,ϵkN(0,I)

这看起来是不是非常眼熟?

👉SGD + Gaussian noise

五、和机器学习的对应关系

5.1 Langevin MCMC

令:

U ( x ) = − log ⁡ p ( x ) U(x) = - \log p(x)U(x)=logp(x)

则更新变成:

x k + 1 = x k + η ∇ log ⁡ p ( x k ) − 2 η ϵ k x_{k+1} = x_k + \eta \nabla \log p(x_k) - \sqrt{2\eta}\epsilon_kxk+1=xk+ηlogp(xk)2ηϵk

👉用梯度信息做 MCMC

5.2 SGLD(Stochastic Gradient Langevin Dynamics)

在大数据场景中:

  • 用 mini-batch 估计∇ log ⁡ p ( x \nabla \log p(xlogp(x)
  • 噪声天然存在

👉 SGD ≈退化版 Langevin dynamics

六、和 Diffusion Model 的关系

6.1 反向扩散 = Langevin-like dynamics

扩散模型的反向 SDE:

d x = [ f ( x , t ) − g ( t ) 2 ∇ x log ⁡ p t ( x ) ] d t + g ( t ) d W ˉ t \mathrm{d}x = \big[ f(x,t) - g(t)^2 \nabla_x \log p_t(x) \big] \mathrm{d}t + g(t)\mathrm{d}\bar W_tdx=[f(x,t)g(t)2xlogpt(x)]dt+g(t)dWˉt

其中:

  • ∇ x log ⁡ p t ( x \nabla_x \log p_t(xxlogpt(x):score
  • 噪声 + score 驱动采样

👉 本质上是时间变化版 Langevin dynamics

5.2 Score matching = 学梯度

  • Langevin dynamics:已知∇ log ⁡ p ( x \nabla \log p(xlogp(x)→ 采样
  • Diffusion model:先学 score→ 再用 Langevin/SDE 采样

七、和 Tweedie Estimator1的桥梁

在高斯噪声下:

E [ x 0 ∣ x t ] = x t + σ t 2 ∇ log ⁡ p t ( x t ) \boxed{ \mathbb{E}[x_0 \mid x_t] = x_t + \sigma_t^2 \nabla \log p_t(x_t) }E[x0xt]=xt+σt2logpt(xt)
这意味着:

👉 反向扩散 =连续去噪版 Langevin dynamics

八、总结

Langevin dynamics 是:


参考


  1. 一文解释 经验贝叶斯估计, Tweedie’s formula ↩︎

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 9:33:36

使用alive-progress打造Python动态进度条的完整指南

使用alive-progress打造Python动态进度条的完整指南 【免费下载链接】alive-progress A new kind of Progress Bar, with real-time throughput, ETA, and very cool animations! 项目地址: https://gitcode.com/gh_mirrors/al/alive-progress 想要为你的Python项目添加…

作者头像 李华
网站建设 2026/6/15 3:28:00

供需缺口+AI算力需求+降息憧憬,白银突破66美元后走势几何?

“白银溢价”正在成为全球金融市场的热词。随着银价强势突破66美元,市场原本的估值模型似乎已失效。这背后是“供需缺口”、“AI算力刚需”与“央行降息预期”形成的三重共振。本文将从产业链的微观视角出发,结合宏观资金流向,深入探讨在66美…

作者头像 李华
网站建设 2026/6/12 11:24:04

SLIM容器优化工具终极指南:从臃肿镜像到精悍部署

你是否曾为Kubernetes集群中臃肿的容器镜像烦恼?构建速度慢、存储成本高、部署延迟长——这些问题不仅影响开发效率,更直接制约着系统的可扩展性。作为CNCF沙箱项目,SLIM(SlimToolkit)通过智能分析技术,可将…

作者头像 李华
网站建设 2026/6/14 15:22:56

基于51单片机火灾报警器设计

基于51单片机的火灾报警器设计 第一章 绪论 火灾作为危害公共安全的主要灾害之一,具有蔓延速度快、破坏性强、救援难度大等特点,传统火灾报警设备多依赖单一传感器检测,存在响应滞后、误报率高、功能单一等问题,难以满足家庭、小…

作者头像 李华
网站建设 2026/6/15 6:37:31

基于51单片机技术的智能柜拒收物系统

基于51单片机技术的智能柜拒收物系统设计 第一章 绪论 随着智能柜在社区、写字楼、快递驿站等场景的广泛应用,传统智能柜仅具备储物与解锁功能,缺乏对违禁品、超规格物品的识别能力,需依赖人工核查,存在效率低下、安全隐患等问题…

作者头像 李华