news 2026/5/1 11:16:12

DAY54 CBAM注意力

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
DAY54 CBAM注意力

1. 通道注意力模块(Channel Attention Module)复习

通道注意力解决的是“看什么” (What) 的问题,即在众多的特征通道中,哪些通道包含更有用的信息。

  • 核心逻辑

    • 双重池化:同时使用全局平均池化 (AvgPool)全局最大池化 (MaxPool)。平均池化保留全局背景,最大池化捕捉最显著的特征(如强边缘、高亮处)。

    • 共享 MLP:将池化后的向量送入一个共享的全连接层(通常包含降维和升维,以减少参数量),学习通道间的依赖关系。

    • 权重生成:将两个池化的结果相加,通过Sigmoid激活函数生成 0 到 1 之间的权重,最后乘回原始特征图,实现对重要通道的加强和无效通道的抑制。

2. 空间注意力模块(Spatial Attention Module)

空间注意力解决的是“在哪里” (Where) 的问题,即在图像的特征图中,哪些位置(像素点)是关键区域。

  • 核心逻辑

    • 维度压缩:沿着通道轴进行平均池化和最大池化,把 C 个通道压缩成 2 个通道(一张均值图和一张最大值图)。

    • 特征融合:将这两张图拼接(Concat),然后使用一个较大的卷积核(如)进行卷积。大卷积核能提供更大的感受野,帮助模型理解物体的位置关系。

    • 权重生成:卷积输出经过Sigmoid得到空间权重图,覆盖在特征图上,让模型“盯住”重点区域(如猫的头部),忽略背景区域。

3. CBAM 的定义(Convolutional Block Attention Module)

CBAM 是一种轻量级、即插即用的卷积神经网络注意力模块。

  • 定义:它将“通道注意力”和“空间注意力”组合在一起。通过串行的方式(先计算通道注意力,再在结果上计算空间注意力),对特征进行双重强化。

  • 三大特点

    1. 双重维度:比传统的 SE 模块(仅通道注意力)多了一个空间维度,提升了模型定位目标的能力。

    2. 即插即用:它可以直接插入到任何现有的卷积网络(如 ResNet, MobileNet, YOLO 等)的卷积层之间,无需改变原网络的主体结构。

    3. 高效性:它增加的参数量极少,但在图像分类、目标检测等任务中通常能带来明显的性能提升。

一句话总结:

CBAM 通过通道注意力告诉模型“什么特征重要”,再通过空间注意力告诉模型“哪里重要”,二者结合让特征表达更加精准。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/20 18:28:48

如何快速安装Typora OneDark主题:完整配置指南

如何快速安装Typora OneDark主题:完整配置指南 【免费下载链接】typora-onedark-theme A dark theme for Typora inspired by VScodes One Dark Pro theme. 项目地址: https://gitcode.com/gh_mirrors/ty/typora-onedark-theme Typora OneDark主题是一款专为…

作者头像 李华
网站建设 2026/5/1 11:01:07

如何高效微调OCR大模型?PaddleOCR-VL-WEB一键部署指南

如何高效微调OCR大模型?PaddleOCR-VL-WEB一键部署指南 在文档数字化和自动化处理需求日益增长的今天,OCR(光学字符识别)技术早已不再局限于简单的文字提取。面对复杂的版面结构、多语言混合内容、表格与公式的精准还原等挑战&…

作者头像 李华
网站建设 2026/4/26 14:24:36

Z-Image-Turbo种子固定技巧:manual_seed(42)复现结果方法

Z-Image-Turbo种子固定技巧:manual_seed(42)复现结果方法 集成Z-Image-Turbo文生图大模型(预置30G权重-开箱即用) 基于阿里ModelScope Z-Image-Turbo构建的文生图环境。已预置全部32GB模型权重文件于系统缓存中,无需重新下载&am…

作者头像 李华
网站建设 2026/5/1 7:13:24

猫抓浏览器扩展:网页资源嗅探与下载实战指南

猫抓浏览器扩展:网页资源嗅探与下载实战指南 【免费下载链接】cat-catch 猫抓 chrome资源嗅探扩展 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 你是否曾经遇到过这样的情况:在网上看到一个精彩的视频,想要保存下来却…

作者头像 李华
网站建设 2026/5/1 7:22:13

PCIe-Virtual channel Mechanism(2)

Virtual Channel Identification (VC ID) VC ID规则和MFVC结构,是在硅片上实现可预测服务质量、防止死锁、并高效管理昂贵硬件资源的物理设计蓝图和系统集成契约。 规则一:端口内VC ID分配必须唯一——硬件队列的“身份证”制度 SoC设计角度:这意味着在您为SoC的一个PCIe端…

作者头像 李华