news 2026/5/1 10:42:38

【ICCV25-汪烈军-新疆大学】相似性记忆先验是医学图像分割的关键

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【ICCV25-汪烈军-新疆大学】相似性记忆先验是医学图像分割的关键

文章:Similarity Memory Prior is All You Need for Medical Image Segmentation

代码:https://github.com/vpsg-research/Sim-MPNet

单位:新疆大学


一、问题背景:传统模型的医学图像分割困境

当前医学图像分割的主流方法,主要依赖CNN(卷积神经网络)和ViT(视觉Transformer),以及二者的融合模型,但这些方法在面对医学图像时,都存在难以规避的问题:

  1. CNN的局部局限:CNN的局部感受野设计,只能被动识别图像的边缘、角落等局部纹理,无法主动建模“肝脏”“肿瘤”这类语义化的器官/病灶目标,分割大病灶、复杂器官时效果不佳;

  2. ViT的数据依赖:ViT的自注意力机制本应捕捉全局信息,但医学图像标注数据稀缺,导致模型难以学习到有效的位置编码语义关联,最终沦为“伪全局建模”,依旧只关注高频纹理,忽略解剖结构;

  3. 共性问题:无先验知识:CNN和ViT都属于数据驱动的“隐式学习”,缺乏针对医学目标的先验知识,无法快速定位和识别图像中的关键特征。

而研究人员从灵长类视觉系统中获得启发——猕猴初级视觉皮层中存在“祖母细胞”,这类细胞仅对特定视觉刺激产生反应,具备极强的目标识别能力。这一生物机制为研究指明了方向:让模型跳出传统计算框架,直接聚焦于医学图像中的类别特征(器官/病灶),为模型赋予“记忆先验”,或许是突破医学图像分割瓶颈的关键。

二、方法创新:Sim-MPNet的核心设计,给AI加“记忆库”

研究团队基于“祖母细胞”的生物启发,设计了Similarity Memory Prior Network(Sim-MPNet)相似性记忆先验网络,核心是为模型构建动态的原型记忆库,让模型能主动匹配、提取并更新医学目标的类别特征,同时搭配双编码器结构,融合局部与全局信息。整个模型的创新点集中在两个核心模块和一套动态更新策略:

1. 动态记忆权重-损失注意力模块(DMW-LA):AI的“记忆提取器”

这一模块是模型的核心,负责从医学图像中直接抓取器官/病灶的核心类别特征,模拟“祖母细胞”的特异性识别能力:

  • 先通过K-means聚类为原型记忆库初始化相似性记忆先验(各类医学目标的特征模板),模型利用余弦相似性,将图像特征与记忆库中的核心模板匹配,精准定位对应目标;

  • 匹配后通过自注意力机制,提取图像中与模板对应的语义类别特征,让模型直接捕捉医学图像的抽象类别信息,大幅提升分割能力。

2. 权重-损失动态更新策略(W-LD):让“记忆库”越用越准

为解决传统记忆机制更新灵活度低的问题,团队设计了非随机的W-LD更新策略,让原型记忆库能根据训练情况动态优化:

  • 特征权重筛选:保留图像中高权重的有效特征,替换记忆库中低权重的无效特征,减少冗余信息;

  • 训练损失调整:通过对比当前与上一轮训练的损失值,动态调整记忆库的更新范围,损失下降时减小更新范围保留有效特征,损失上升时扩大更新范围剔除无用特征,让记忆库持续积累高价值语义信息。

3. 双相似性全局内部增强模块(DS-GIM):AI的“细节分辨器”

针对医学图像中不同目标特征相似、难以区分的问题,该模块同时利用余弦相似性欧氏距离,从特征分布和空间位置两个维度,精细挖掘医学图像的内部特征差异,强化模型对细微纹理、复杂轮廓的分辨能力,让模型能更好地区分相似的器官/病灶。

4. 双编码器结构:融合局部与全局信息

Sim-MPNet采用双编码器设计,一个由DMW-LA和DS-GIM交替堆叠而成,负责类别特征提取;另一个基于MaxViT构建,负责强化全局上下文学习。两个编码器的特征经融合后,结合通道+空间注意力的跳跃连接和解码器,最终实现像素级的精准分割,有效减少信息损失。

三、实验结果:四大公开数据集验证,刷新SOTA

为验证Sim-MPNet的性能,研究团队在ACDC(心脏MRI)、SegPC-2021(骨髓瘤浆细胞)、ISIC-2018(皮肤病变)、Synapse(腹部CT多器官)四大国际公开医学图像分割数据集上开展了全面实验,以Dice相似度(DSC,越高越好)和95%豪斯多夫距离(HD95,越低越好)为核心评价指标,与CNN、ViT、CNN-ViT融合、记忆机制等各类主流SOTA方法对比,结果表现亮眼:

  1. ACDC心脏数据集:Sim-MPNet的DSC达到92.18%,显著高于各类对比模型,精准分割左心室、右心室和心肌,解决了传统模型局部特征捕捉不足的问题;

  2. SegPC-2021细胞数据集:面对紧密连接的浆细胞,模型DSC达83.12%,相较最优对比模型提升2.40%,HD95降低2.42mm,对细胞细胞质、细胞核的分割精度大幅提升;

  3. ISIC-2018皮肤病变数据集:针对大尺度皮肤病变,模型验证了优秀的全局建模能力,DSC达90.85%,相较ViT类最优模型提升0.74%,HD95降低0.52mm;

  4. Synapse腹部多器官数据集:这一数据集包含9类腹部器官,轮廓复杂、差异大,Sim-MPNet取得84.34%的平均DSC和14.85的HD95,均为所有对比模型最优,在左肾、右肾、胆囊等器官上的分割精度均超越现有方法,展现出极强的场景鲁棒性。

同时,消融实验也验证了核心模块的有效性:移除DMW-LA或DS-GIM后,模型在所有数据集上的性能均出现明显下降,证明了相似性记忆先验和双相似性增强机制的核心作用。

四、优势与局限

核心优势

  1. 全新的特征提取范式:跳出传统CNN/ViT的学习框架,将生物视觉的“祖母细胞”机制融入模型,通过相似性记忆先验让模型主动识别、记忆医学目标类别特征,而非被动学习纹理,为医学图像分割提供了全新研究思路;

  2. 动态灵活的记忆机制:W-LD更新策略让原型记忆库能根据训练情况自适应优化,解决了传统记忆机制灵活性低、易引入冗余信息的问题,适配医学图像目标形态多变的特点;

  3. 强鲁棒性与泛化性:在心脏、细胞、皮肤病变、腹部多器官等不同类型、不同复杂度的医学图像数据集上均取得SOTA性能,能适配不同临床场景的分割需求;

  4. 精准的细节分辨能力:DS-GIM模块结合两种相似性度量,强化了模型对细微特征差异的捕捉,能有效分割轮廓复杂、特征相似的医学目标。

现存局限

  1. 计算成本方面:Sim-MPNet采用双编码器结构,相比单编码器的传统模型,在参数量和计算量(FLOPs)上不占优势,推理效率虽能满足基本需求,但仍有优化空间;

  2. 局部特征建模:在部分轮廓极度复杂的小器官(如胰腺)分割中,模型对局部元素的相关性捕捉仍有不足,未能达到最优分割效果,局部建模能力仍可进一步强化;

  3. 小样本场景适配:虽模型引入了先验知识,但在极少量标注的小样本医学图像场景中,记忆库的初始化和更新效果仍需进一步验证。

五、一句话总结

新疆大学团队提出的Sim-MPNet网络,将灵长类视觉系统的“祖母细胞”机制与医学图像分割结合,通过构建动态的相似性记忆先验,让模型实现了医学目标类别特征的主动提取与记忆,在四大公开数据集上刷新SOTA,为医学图像分割提供了全新的生物启发式研究范式,也为后续结合先验知识的医学计算机视觉研究奠定了基础。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 6:47:34

Kafka 与大数据存储系统的完美融合方案

Kafka 与大数据存储系统的完美融合方案 关键词:Kafka、大数据存储、实时数据流、数据融合、分布式系统 摘要:在数字化时代,企业每天产生海量实时数据(如用户行为、IoT传感器、交易记录),这些数据需要“既快又稳”地被处理和存储。Kafka作为全球最流行的实时数据流平台,擅…

作者头像 李华
网站建设 2026/5/1 8:49:00

cv_resnet50_face-reconstruction VSCode Python环境配置详解

cv_resnet50_face-reconstruction VSCode Python环境配置详解 想在自己的电脑上跑通那个能从一张照片生成3D人脸的神奇模型吗?很多朋友在第一步——配置开发环境上就卡住了。网上的教程要么太零散,要么默认你已经是个Python老手,对新手一点都…

作者头像 李华
网站建设 2026/5/1 9:13:12

零基础教程:用亚洲美女-造相Z-Turbo一键生成惊艳人像

零基础教程:用亚洲美女-造相Z-Turbo一键生成惊艳人像 最近想用AI生成一些符合亚洲审美的精致人像,但发现很多模型要么对中文理解不好,要么生成的亚洲面孔总带着点“异域风情”,要么就是部署起来太复杂,对电脑配置要求…

作者头像 李华
网站建设 2026/5/1 7:57:06

小白必看!Cosmos-Reason1-7B推理工具保姆级使用教程

小白必看!Cosmos-Reason1-7B推理工具保姆级使用教程想用AI解决数学题、逻辑推理或编程问题,但担心隐私泄露或使用限制?这个纯本地运行的推理工具可能是你的最佳选择你是否遇到过这样的情况:遇到复杂的数学题需要一步步推理&#x…

作者头像 李华
网站建设 2026/5/1 9:28:53

DeerFlow快速验证:新功能上线前的沙盒测试环境搭建

DeerFlow快速验证:新功能上线前的沙盒测试环境搭建 1. 引言:为什么需要一个“沙盒”? 想象一下,你正在开发一个全新的AI功能,比如让DeerFlow能自动分析财报并生成投资建议。这个功能很酷,但直接在生产环境…

作者头像 李华
网站建设 2026/5/1 9:32:33

Git-RSCLIP快速上手:遥感图像分类不求人

Git-RSCLIP快速上手:遥感图像分类不求人 1. 为什么遥感图像分类不再需要训练模型? 你是否遇到过这样的问题:手头有一批卫星图或航拍影像,想快速知道图里是农田、森林还是城市建筑,但又不想花几周时间准备数据、搭建环…

作者头像 李华