news 2026/5/24 8:26:59

YOLO系列算法改进 | C2PSA改进篇 | 融合SAMC结构感知多上下文注意力 | 多尺度结构对齐与判别力增强双突破,适用于低对比度医学图像检测与边缘部署场景 | AAAI 2026

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
YOLO系列算法改进 | C2PSA改进篇 | 融合SAMC结构感知多上下文注意力 | 多尺度结构对齐与判别力增强双突破,适用于低对比度医学图像检测与边缘部署场景 | AAAI 2026

0. 前言

本文介绍SAMC结构感知多上下文注意力模块,并将其集成到ultralytics最新发布的YOLO26目标检测算法中,构建C2PSA_SAMC创新模块。SAMC是一种专为结构感知设计的双注意力机制,通过通道-空间协同注意力与多尺度上下文融合,旨在解决医学图像中低对比度、边界模糊和类间差异细微等固有挑战。将SAMC嵌入YOLOv26的C2PSA模块中,能够显著增强模型对目标边缘与结构细节的感知能力,使模型在保留实时推理速度的同时,精准捕捉病灶轮廓、器官边界等关键解剖结构,尤其适用于超声影像分析、病理切片检测等对结构完整性与判别精度要求严苛的临床辅助诊断场景,有效缓解因图像噪声和边界模糊导致的漏检与误检问题。

专栏链接:YOLO系列算法改进专栏链接

专栏文章:YOLO26改进系列 | 卷积篇、轻量化、注意力、损失函数、Backbone、SPPF、C2PSA、Neck、检测头全方面保姆级优化合集 | 同样适配YOLOv11改进!!!

目录

0. 前言

1. SAMC注意力简介

2. SAMC注意力原理与创新点

🧠 SAMC注意力基本原理

🎯 SAMC注意力创新点

3. 具体改进步骤

🍀🍀步骤1:创建C2PSA_SAMC.py文件

🍀🍀步骤2:tasks.py文件修改

🍀🍀步骤3:创建YAML配置文件

🍀🍀步骤4:新建train.py文件训练模型

🍀🍀步骤5:模型结构打印结果


1. SAMC注意力简介

超声标准平面识别对于疾病筛查、器官评估和生物测量等临床任务至关重要。然而,现有方法未能有效利用浅层结构信息,且难以通过图像增强生成的对比样本捕捉细粒度语义差异,最终导致超声标准平面对结构和判别细节的识别效果欠佳。为解决这些问题,本文提出SEMC,一种新颖的结构增强混合专家 对比学习框架,将结构感知特征融合与专家引导对比学习相结合。具体而言,本文首先引入一种新颖的语义-结构融合模块(SSFM),通过有效对齐浅层和深层特征,利用多尺度结构信息增强模型对细粒度结构细节的感知能力。然后,设计了一种新颖的混合专家对比识别模块(MCRM),通过混合专家机制对多层次特征进行分层对比学习和分类,进一步提升类间可分性和识别性能。更重要的是,本文还构建了一个大规模、精细标注的包含六个标准平面的肝脏超声数据集 。在我们内部数据集和两个公共数据集上的大量实验结果表明,SEMC在各个指标上均优于最新的最先进方法。

原始论文:https://arxiv.org/pdf/2511.12559

原始

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/1 12:50:47

即插即用系列 | AAAI 2026 | SAMC:结构感知多上下文块!多尺度分流与双注意力协同,精准捕获目标结构信息与多维度上下文关联! | 代码分享

0. 前言 本文介绍了SAMC结构感知多上下文块(Structure-Aware Multi-Context Block),其通过多尺度并行分流策略与通道-空间双注意力协同机制,首次在超声标准平面识别领域实现浅层结构线索与深层语义特征的精准对齐与深度融合&…

作者头像 李华
网站建设 2026/4/4 7:27:43

Python自动化抢票神器:3步配置,告别手动刷新时代

Python自动化抢票神器:3步配置,告别手动刷新时代 【免费下载链接】Automatic_ticket_purchase 大麦网抢票脚本 项目地址: https://gitcode.com/GitHub_Trending/au/Automatic_ticket_purchase 还在为演唱会门票秒光而烦恼吗?每次热门演…

作者头像 李华
网站建设 2026/4/3 1:22:21

百度文库文档高效获取指南:免费无限制下载工具全解析

百度文库文档高效获取指南:免费无限制下载工具全解析 【免费下载链接】baidu-wenku fetch the document for free 项目地址: https://gitcode.com/gh_mirrors/ba/baidu-wenku 在信息爆炸的时代,优质文档资源的获取往往受限于付费壁垒或格式限制。…

作者头像 李华
网站建设 2026/4/7 16:24:48

Cesium Polylines完全指南:从基础绘制到高级材质应用

Cesium Polylines完全指南:从基础绘制到高级材质应用 在三维地理可视化领域,Cesium作为领先的WebGIS开发框架,其强大的图元系统为开发者提供了丰富的可视化手段。其中,Polylines(折线)作为基础图元之一&am…

作者头像 李华
网站建设 2026/4/1 12:49:30

拆穿名词诈骗!用大白话理解晦涩难懂的AI概念

1、普通的insert into 如果(主键/唯一建)存在,则会报错 新需求:就算冲突也不报错,用其他处理逻辑 回到顶部 2、基本语法(INSERT INTO ... ON CONFLICT (...) DO (UPDATE SET ...)/(NOTHING)) 语…

作者头像 李华
网站建设 2026/4/1 12:48:13

构建基于Kandinsky-5.0-I2V-Lite-5s的数据库应用:生成视频素材的元数据管理

构建基于Kandinsky-5.0-I2V-Lite-5s的数据库应用:生成视频素材的元数据管理 1. 场景概述与核心价值 电商平台每天需要为数千款商品制作动态展示视频,传统视频制作方式成本高、周期长。我们设计了一套智能视频素材生产系统,用户只需上传商品…

作者头像 李华