news 2026/5/1 9:30:21

AI全景之第五章第一节:深度学习(卷积神经网络CNN)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI全景之第五章第一节:深度学习(卷积神经网络CNN)

第五章:卷积神经网络(CNN):从LeNet到ConvNeXt的演进

学习目标

深入理解卷积神经网络的基本原理与核心设计思想,掌握CNN架构演进的关键突破点,能够分析不同CNN变体的适用场景,并具备根据任务需求选择或设计合适CNN架构的能力。


一、卷积神经网络的基石:核心思想与基本组件

1.1 卷积操作的本质:从全连接到局部连接

传统神经网络的局限性
  • 全连接网络:每个神经元与上一层的所有神经元相连
  • 参数爆炸:对于图像数据(如224×224×3 = 150,528像素),单层全连接就需要数亿参数
  • 平移不变性缺失:相同特征出现在不同位置需要重新学习
卷积的核心创新
  1. 局部连接(局部感受野)

    • 每个神经元仅连接输入区域的局部
    • 生物启发:视觉皮层神经元仅处理视野的局部区域
    • 数学表达:yi,j=∑m=0k−1∑n=0k−1wm,n⋅xi+m,j+n+by_{i,j} = \sum_{m=0}^{k-1} \sum_{n=0}^{k-1} w_{m,n} \cdot x_{i+m,j+n} + byi,j=m=0k1n=0k1wm,nxi+m,j+n+b
  2. 权值共享(卷积核)

    • 同一卷积核在输入的不同位置使用相同的权重
    • 显著减少参数:从百万级降至百级
    • 实现平移等变性:无论特征出现在何处,使用相同检测器
  3. 多通道设计

    • 输入:彩色图像有RGB三个通道
    • 输出:每个卷积核生成一个特征图,多个卷积核形成多通道特征
    • 三维卷积核:处理多通道输入,融合跨通道信息

1.2 卷积网络的基本架构组件

卷积层(Convolution Layer)
# 卷积操作的核心参数kernel_size=3# 卷积核大小,常用3×3, 5×5, 7×7stride=1# 滑动步长,控制输出尺寸padding='same'# 填充方式,保持空间尺寸或减小filters=64# 卷积核数量,决定输出通道数
池化层(Pooling Layer)
  • 最大池化:提取最显著特征,增强平移不变性
  • 平均池化:平滑特征,减少噪声影响
  • 全局池化:将特征图压缩为标量,替代全连接层
激活函数
  • ReLU(Rectified Linear Unit)f(x)=max(0,x)f(x) = max(0, x)f(x)=max(0,x)
    • 优点:计算简单,缓解梯度消失,加速收敛
    • 缺点:神经元"死亡"问题(负值完全抑制)
  • 变种:LeakyReLU、PReLU、ELU、GELU
归一化层
  • 批归一化(BatchNorm):对小批量数据标准化,稳定训练
  • 层归一化(LayerNorm):对单个样本所有特征标准化,适用于RNN
  • 实例归一化(InstanceNorm):风格迁移任务常用

二、CNN演进里程碑:从开创到成熟

2.1 开创期:LeNet-5(1998)——卷积网络的雏形

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/30 18:11:03

开题报告还能玩起来?这款AI工具把学术写作变成了“游戏通关”

凌晨两点,宿舍的灯还亮着。面对屏幕上那片令人窒息的空白文档和导师那条“明天必须交初稿”的消息,你感到前所未有的压力。开题报告这个看似简单的任务,却成了无数学生学术道路上的第一道“鬼门关”——选题没方向、文献找不到、框架理不清、…

作者头像 李华
网站建设 2026/4/23 15:45:45

当毕业论文遇上AI:智能工具如何重塑学术写作体验

夜深了,图书馆的灯光下,键盘敲击声连续不断。毕业论文季,这个让无数学子辗转难眠的时期,已经随着人工智能技术的发展悄然发生变化。在众多承诺能“简化写作流程”的AI工具中,一款名为虎贲等考AI智能写作的平台正试图通…

作者头像 李华
网站建设 2026/4/23 18:41:11

9款AI写论文工具深度实测:哪一款能成为你的毕业神助攻?

面对堆积如山的文献和步步紧逼的截止日期,这位机械工程专业的研究生将论文的最后一章交给了虎贲等考AI。五分钟后,AI不仅完成了内容填充,还附带了一份详尽的引文清单,其中两篇文献恰好是他之前在知网上标记过、却忘记引用的关键论…

作者头像 李华
网站建设 2026/4/27 9:15:18

写论文软件哪个好?甩掉“幻觉”和虚构,找对能交付“真实”的那个

输入同样的关键词,别人拿到的是一篇引经据典、数据图表齐备的论文初稿,而你得到的却是一份满是“查无此文”的虚构引用和经不起推敲的空洞论述——这或许是2025年最扎心的学术效率鸿沟。深夜的图书馆里,键盘敲击声此起彼伏。李同学盯着屏幕上…

作者头像 李华
网站建设 2026/5/1 8:18:35

掌握web控件定位技巧,提升页面操作效率

在做 Web 自动化时,最根本的就是操作页面上的元素,首先要能找到这些元素,然后才能操作这些元素。工具或代码无法像测试人员一样用肉眼来分辨页面上的元素。那么要如何定位到这些元素,本章会介绍各种定位元素的方法。 web 控件定位…

作者头像 李华
网站建设 2026/4/25 19:01:59

SpringBoot 中如何利用 Junit 实现单元测试?

在SpringBoot中&#xff0c;可以利用JUnit来实现单元测试。 以下是一般的JUnit单元测试步骤&#xff1a; 1.添加JUnit依赖 在Maven的pom.xml文件中添加JUnit依赖&#xff1a; <dependency>    <groupId>junit</groupId>    <artifactId>j…

作者头像 李华