news 2026/6/15 18:25:57

2025.12.28日周报

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
2025.12.28日周报

12.28日周报

  • 一、文献阅读
    • 题目信息
    • 摘要
    • 创新点
    • 网络框架
      • 1. ConvLSTM 单元结构
      • 2. 编码器-预测器模型
    • 实验
      • 实验一:Moving MNIST 数据集
      • 实验二:雷达回波数据集
    • 结论
    • 不足与展望

一、文献阅读

题目信息

题目:《Convolutional LSTM Network: A Machine Learning Approach for Precipitation Nowcasting》
期刊/会议:NIPS 2015 (Advances in Neural Information Processing Systems)
作者:Xingjian Shi, Zhourong Chen, Hao Wang, Dit-Yan Yeung, Wai-kin Wong, and Wang-chun Woo
发表时间:2015
文章链接:https://arxiv.org/abs/1506.04214

摘要

本文针对降水临近预报这一极具挑战性的天气预报问题,提出了一种基于机器学习的解决方案。作者将降水临近预报建模为一个时空序列预测问题,即输入和预测目标均为时空序列。为了克服传统全连接长短期记忆网络无法有效提取空间特征的局限性,提出了卷积LSTM。通过将LSTM内部的状态到状态、输入到状态的转换操作由全连接改为卷积操作,ConvLSTM能够同时建立时间与空间的相关性模型。实验结果表明,ConvLSTM在合成的Moving MNIST数据集和真实的雷达回波数据集上,均能比FC-LSTM和当时的业务算法更好地捕捉时空相关性,显著提升了预报准确率。

创新点

  1. 提出了卷积LSTM网络架构,传统的FC-LSTM在处理图像序列时需要将二维数据展平为一维向量,导致空间信息丢失。ConvLSTM通过在输入-状态和状态-状态的转换中引入卷积操作,使得模型能够保留输入数据的空间结构,从而同时提取时间及空间特征。
  2. 将降水临近预报形式化为时空序列预测问题,不同于传统的基于光流法的方法,本文是一个端到端的可训练深度学习模型,直接从雷达回波图序列学习降水的演变规律。
  3. 设计了编码器-预测器结构,借鉴了机器翻译中的seq2seq模型,构建了由ConvLSTM堆叠而成的编码器网络和预测器网络,前者用于压缩历史时空信息,后者用于生成未来的预测序列。

网络框架

1. ConvLSTM 单元结构

ConvLSTM 是全连接 LSTM 的扩展。
在 ConvLSTM 中,所有的输入X t X_tXt、细胞输出C t C_tCt、隐藏状态H t H_tHt和门控信号(i t , f t , o t i_t, f_t, o_tit,ft,ot)都是三维张量,其最后两个维度为空间维度(行和列)。
核心公式中的矩阵乘法被替换为卷积操作
其中,∗ *表示卷积,∘ \circ表示哈达玛积:i t = σ ( W x i ∗ X t + W h i ∗ H t − 1 + W c i ∘ C t − 1 + b i ) f t = σ ( W x f ∗ X t + W h f ∗ H t − 1 + W c f ∘ C t − 1 + b f ) C t = f t ∘ C t − 1 + i t ∘ tanh ⁡ ( W x c ∗ X t + W h c ∗ H t − 1 + b c ) o t = σ ( W x o ∗ X t + W h o ∗ H t − 1 + W c o ∘ C t + b o ) H t = o t ∘ tanh ⁡ ( C t ) \begin{aligned} i_t &= \sigma(W_{xi} * \mathcal{X}_t + W_{hi} * \mathcal{H}_{t-1} + W_{ci} \circ \mathcal{C}_{t-1} + b_i) \\ f_t &= \sigma(W_{xf} * \mathcal{X}_t + W_{hf} * \mathcal{H}_{t-1} + W_{cf} \circ \mathcal{C}_{t-1} + b_f) \\ \mathcal{C}_t &= f_t \circ \mathcal{C}_{t-1} + i_t \circ \tanh(W_{xc} * \mathcal{X}_t + W_{hc} * \mathcal{H}_{t-1} + b_c) \\ o_t &= \sigma(W_{xo} * \mathcal{X}_t + W_{ho} * \mathcal{H}_{t-1} + W_{co} \circ \mathcal{C}_t + b_o) \\ \mathcal{H}_t &= o_t \circ \tanh(\mathcal{C}_t) \end{aligned}itftCtotHt=σ(WxiXt+WhiHt1+WciCt1+bi)=σ(WxfXt+WhfHt1+WcfCt1+bf)=ftCt1+ittanh(WxcXt+WhcHt1+bc)=σ(WxoXt+WhoHt1+WcoCt+bo)=ottanh(Ct)

展示了输入数据和状态在 LSTM 单元内部的处理流程,核心区别在于使用了卷积操来处理二维空间数据,而非传统的全连接乘法。

2. 编码器-预测器模型

为了进行多步预测,模型采用了类似于seq2seq的结构。
编码网络:由多层ConvLSTM组成,接收历史序列输入,将其压缩为隐藏状态张量。
预测网络:同样由多层 ConvLSTM 组成,利用编码网络的最终状态作为初始状态,逐步生成未来的预测帧。
网络结构是左侧为编码路径,输入历史雷达图;右侧为预测路径,输出未来雷达图。
两个网络均由堆叠的ConvLSTM层构成

实验

作者在两个数据集上进行了实验:合成的Moving MNIST数据集和真实的雷达回波数据集。

实验一:Moving MNIST 数据集

该实验旨在验证模型学习简单时空移动规律的能力。数据集由两个在黑色背景上反弹的移动数字组成。
ConvLSTM相比FC-LSTM能够更清晰地预测出数字的移动轨迹和形状,FC-LSTM的预测结果不仅模糊,而且难以捕捉复杂的重叠运动。ConvLSTM尤其是多层结构,如3层表现最佳。

实验二:雷达回波数据集

使用香港天文台提供的雷达回波数据,包含97个雨天的记录。任务是根据过去5帧预测未来15帧。
预测指标为:降雨率均方误差 (MSE)、CSI (Critical Success Index)、FAR (False Alarm Rate)、POD (Probability of Detection)。

ConvLSTM 在各项指标上均优于 FC-LSTM 和当时业务上使用的基于光流法的ROVER算法。特别是在较长时效的预测中,ConvLSTM的优势更加明显,能够保持较好的降水结构。

结论

本文提出了ConvLSTM架构,用于解决降水临近预报问题。通过将卷积结构引入LSTM,该模型成功克服了传统RNN丢失空间信息的缺陷,能够有效地建立时空序列的相关性模型。实验证明,ConvLSTM在处理包含复杂时空变化的数据时,表现优于全连接LSTM和传统的非机器学习方法,为气象领域的时空序列预测提供了一个强大的基准模型。

不足与展望

虽然比FC-LSTM好,但在长时预测中,ConvLSTM生成的图像仍然会趋于模糊。这主要是由于使用了均方误差作为损失函数,导致模型倾向于输出平均化的结果。未来可以考虑引入生成对抗网络或更感知的损失函数来提升清晰度;相比FC-LSTM,卷积操作的计算开销较大,训练和推理速度相对较慢;目前的模型纯粹是数据驱动的,未结合大气动力学方程。未来的研究可以探索将物理约束融入网络设计或损失函数中,以提高预测的物理一致性。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 13:38:05

Windows下STM32CubeMX打不开的超详细版解决方案

STM32CubeMX打不开?别急,这份Windows下全链路排障指南帮你彻底解决 你有没有遇到过这样的场景:刚准备开始一个STM32项目,满怀期待地双击桌面上的 STM32CubeMX 图标,结果——什么都没发生?任务管理器里Ja…

作者头像 李华
网站建设 2026/6/15 15:51:17

Proteus 8.16 Windows安装包结构解析:技术视角解读

深入剖析 Proteus 8.16 安装机制:从部署流程到系统级调试的实战指南你是否曾在执行proteus8.16下载安装教程时,卡在“License not found”或“驱动无法加载”的提示上?你是否尝试过反复重装、关闭杀软、以管理员运行,却依然无法彻…

作者头像 李华
网站建设 2026/6/15 12:47:52

《突破边界束缚!AI上下文工程架构师为提示工程注入新动力》

突破边界束缚!AI上下文工程架构师为提示工程注入新动力 一、引言:你写的Prompt,为什么总“差口气”? 你有没有过这样的经历? 让AI生成产品需求文档,前两段还紧扣“Z世代女性用户”的画像,写到功…

作者头像 李华
网站建设 2026/6/15 14:24:31

自建AI推理平台?TensorRT镜像是你绕不开的技术选型

自建AI推理平台?TensorRT镜像是你绕不开的技术选型 在今天的AI系统设计中,一个训练得再完美的模型,如果跑不快、耗资源、响应慢,那它在生产环境里几乎寸步难行。尤其是在视频流分析、智能客服对话、自动驾驶感知这类对实时性要求…

作者头像 李华
网站建设 2026/6/15 13:10:55

iOS核心开发手册【1.2】

1.7 解决方案:针对位图的触摸测试解决方案1-5所用的触摸判定方式非常直观,它只做了一些简单的几何运算,但不巧的是,大部分视图都不是解决方案1-5所演示的样子。比方说,对于图1-1中的花朵,其边界就是不规则的…

作者头像 李华
网站建设 2026/6/15 13:11:52

iOS核心开发手册【1.3】

1.13 解决方案:把滚动视图中的内容拖曳到外面iOS所提供的手势识别器的功能确实很丰富,但并不总是能够满足开发者的需要。比方说,有个可以水平滚动的视图,里面包含许多相邻的图像视图ImageView,用户可以左右滚动这个大视…

作者头像 李华