news 2026/6/15 18:21:09

论文阅读:SIGIR 2025 Advancing Ship Re-Identification in the Wild: The ShipReID-2400 Benchmark Dataset an

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
论文阅读:SIGIR 2025 Advancing Ship Re-Identification in the Wild: The ShipReID-2400 Benchmark Dataset an

总目录 大模型相关研究:https://blog.csdn.net/WhiffeYF/article/details/142132328

https://dl.acm.org/doi/abs/10.1145/3726302.3729892

https://www.doubao.com/chat/35659689586454018

SIGIR 2025 论文目录:https://sigir2025.dei.unipd.it/accepted-papers.html

论文原文:https://download.csdn.net/download/WhiffeYF/92559847

Advancing Ship Re-Identification in the Wild: The ShipReID-2400 Benchmark Dataset and D2InterNet Baseline Method

速览

1. 一段话总结

本文针对船舶重识别(Ship ReID)领域数据集稀缺、船舶尺度变化大、易出现部分拍摄等问题,提出了包含2400个船舶ID、17241张图像(采集自53个月真实航道监控系统)的ShipReID-2400基准数据集,并设计了D2InterNet基线方法——该方法采用双分支架构,通过Part-aware Feature Perception Module(PFPM)、Feature Interaction Module(FIM)和Collaborative Interaction Learning Module(CILM)提取具有判别力的局部特征并融合全局特征,在ShipReID-2400、VesselReID数据集上实现当前最优性能,且在MSMT17行人ReID数据集上展现出良好的泛化能力,相关数据集和代码已开源。


2. 思维导图

## 研究背景与挑战 - 船舶重识别(Ship ReID)的重要性:智能航道运输、海事监控等 - 现有问题 - 数据集:稀缺、多样性不足、非真实场景来源 - 技术挑战:船舶尺度变化大、易部分拍摄、视觉特征不稳定 ## 核心贡献 - 数据集:ShipReID-2400 - 数据规模:2400个ID、17241张图像、53个月采集 - 数据特点:真实监控来源、8个摄像头、高多样性 - 标注与划分:手动校验标注、75:12.5:12.5划分训练/验证/测试集 - 方法:D2InterNet - 架构:双分支(全局+局部) - 核心模块:PFPM、FIM、CILM - 优势:单分支推理无额外开销、泛化能力强 ## 实验结果 - 数据集对比:ShipReID-2400 vs 现有7个数据集(ID数、来源等) - 性能表现:ShipReID-2400上mAP达41.3、R1达45.8(当前最优) - 泛化能力:VesselReID(mAP 60.6)、MSMT17(mAP 73.0)表现优异 - 消融实验:验证PFPM、CILM、FIM等模块有效性 ## 研究意义 - 开源数据集与代码,推动Ship ReID研究 - 应用场景:智能航道、船舶违规排查、生态保护

3. 详细总结

一、研究背景与问题
  1. 研究意义:船舶重识别(Ship ReID)旨在跨时间、跨摄像头视角识别同一船舶,是智能航道运输、海事监控、非法活动追踪的关键技术。
  2. 现有不足
    • 数据集稀缺:仅Boat ReID(107个ID、800张图)和VesselReID(1248个ID、30589张图)公开,且前者来源单一、后者为网络图像(质量不一致、含噪声);
    • 技术挑战:船舶体积大易部分拍摄(数据集94.99%图像为不完整船舶)、舱载/水面条件导致类内尺度变化显著(图像长宽比标准差1.734,高于其他ReID数据集),现有ReID方法难以适配。
二、核心贡献:数据集ShipReID-2400
维度具体信息
数据来源真实航道智能监控系统,8个700万像素摄像头,覆盖≥6000平方公里水域
数据规模2400个独特船舶ID,17241张图像,采集周期53个月
数据标注先用GroundingDINO预标注,再人工校验修正;基于船牌+视觉特征标注ID,隐私保护(模糊船牌)
数据集划分训练集(1800ID、12988张图)、验证集(300ID)、测试集(300ID),比例75:12.5:12.5;验证/测试集分别含691/706张查询图
数据特点时间跨度广(最长拍摄间隔超1200天)、尺度变化大、完整性低,多样性与代表性强
三、核心贡献:D2InterNet基线方法
  1. 整体架构:双分支(全局+局部)设计,支持双分支训练、单分支推理(无额外计算开销)。
  2. 关键模块:
    • 全局特征提取:采用CLIP视觉分支,将图像分割为N个token,通过Transformer学习全局特征,适配船舶外观变化;
    • Part-aware Feature Perception Module(PFPM):局部分支无全局类token,设4个part token,每组对应16×4图像token区域,专注提取船首、船尾等局部判别特征;
    • Feature Interaction Module(FIM):结合全局分支类token与局部分支图像token,生成重要性掩码,筛选关键局部特征;
    • Collaborative Interaction Learning Module(CILM):构建正负特征袋,通过三元组损失让全局特征与近邻局部正特征靠拢、与局部负特征远离,融合跨尺度特征。
  3. 损失函数:L = λ 1 L c e g + λ 2 L t r i g + λ 3 L c e l + λ 4 L t r i l + λ 5 L i n t e r \mathcal{L}=\lambda_{1} \mathcal{L}_{ce}^{g}+\lambda_{2} \mathcal{L}_{tri}^{g}+\lambda_{3} \mathcal{L}_{ce}^{l}+\lambda_{4} \mathcal{L}_{tri}^{l}+\lambda_{5} \mathcal{L}_{inter}L=λ1Lceg+λ2Ltrig+λ3Lcel+λ4Ltril+λ5Linterλ 1 = λ 3 = 0.5 \lambda_1=\lambda_3=0.5λ1=λ3=0.5λ 2 = λ 4 = 5 \lambda_2=\lambda_4=5λ2=λ4=5λ 5 = 10 \lambda_5=10λ5=10)。
四、实验结果
  1. 对比实验(ShipReID-2400)

    • 优于12种现有ReID方法(涵盖行人、车辆、通用对象、遮挡行人ReID),单分支(全局)mAP达40.8、R1达46.2,双分支(全局+局部)mAP达41.3、R1达45.8;
    • 注意力可视化显示,D2InterNet更聚焦船舶局部判别细节(如设备、船首),而非背景或低区分度船体。
  2. 泛化能力验证

    数据集指标最优表现(D2InterNet)对比次优方法提升幅度
    VesselReID(船舶)mAP60.614.1个百分点
    VesselReID(船舶)R172.36.9个百分点
    MSMT17(行人)mAP73.0仅次于CLIP-ReID(73.4)
    MSMT17(行人)R188.0仅次于CLIP-ReID(88.7)
  3. 消融实验

    • 启用PFPM:单分支测试mAP从37.1(仅全局)提升至37.7,双分支训练+全局测试mAP达40.8;
    • 启用CILM:mAP从38.6提升至40.8,R1从45.2提升至46.2;
    • 启用FIM(保留60%token):mAP从40.0提升至40.8;
    • 4个part token为最优配置。
五、研究意义与开源
  • 开源ShipReID-2400数据集与D2InterNet代码(https://github.com/HuiGuanLab/ShipReID-2400),填补船舶ReID高质量数据集空白;
  • 推动智能航道交通、船舶违规排查、生态保护等领域的技术发展。

4. 关键问题

问题1:ShipReID-2400数据集相比现有公开船舶ReID数据集,核心优势是什么?

答案:核心优势体现在三方面:① 规模更大且来源真实:含2400个船舶ID(远超Boat ReID的107个),图像来自53个月真实航道监控系统(而非VesselReID的网络图像),无质量噪声;② 多样性更强:8个摄像头覆盖≥6000平方公里水域,拍摄时间跨度最长超1200天,包含船舶部分拍摄、尺度变化等真实场景挑战;③ 标注规范:结合自动预标注与人工校验,基于船牌+视觉特征确保ID准确性,同时模糊船牌保护隐私,适配ReID任务协议。

问题2:D2InterNet如何针对性解决船舶ReID中“尺度变化大”和“部分拍摄”两大核心挑战?

答案:① 针对尺度变化大:采用双分支架构,全局分支通过CLIP视觉分支提取鲁棒全局特征,适配船舶整体外观变化;局部分支通过PFPM模块设置4个part token,聚焦不同局部区域,捕捉不受尺度影响的判别细节(如船首设备);② 针对部分拍摄:通过FIM模块筛选关键局部特征,过滤因部分拍摄产生的冗余信息;CILM模块融合全局与局部特征,即使船舶仅部分拍摄,也能通过局部判别特征与全局特征的交互实现准确识别,避免单一特征维度的局限性。

问题3:D2InterNet的泛化能力体现在哪里?其泛化性能优异的核心原因是什么?

答案:① 泛化能力体现:不仅在船舶ReID数据集(ShipReID-2400、VesselReID)上实现当前最优性能,还在行人ReID数据集MSMT17上取得mAP 73.0、R1 88.0的 competitive 结果,远超多数专门针对行人ReID的方法;② 核心原因:一是全局分支采用CLIP视觉分支,预训练于海量视觉-文本对,具备强通用特征提取能力;二是双分支架构与交互模块(FIM、CILM)未绑定船舶专属特征,而是聚焦“局部判别特征提取+跨尺度特征融合”的通用问题,可迁移至其他ReID任务。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 13:02:13

python基于vue的小说在线阅读销售平台django flask pycharm

目录技术栈选择核心功能模块数据库设计性能优化策略安全与扩展性开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!技术栈选择 Python作为后端开发语言,搭配Django或Flask框架构建…

作者头像 李华
网站建设 2026/6/15 12:52:04

早降重vs降迹灵AI:论文降重老牌工具和新秀谁更值得用?

早降重vs降迹灵AI:论文降重老牌工具和新秀谁更值得用? TL;DR 实测对比了早降重(老牌降重工具)和降迹灵AI(新秀工具)。早降重界面简洁、专注降重,但降AI是后加的功能,效果中规中矩&…

作者头像 李华
网站建设 2026/6/5 16:00:19

飞算JavaAI智能会话模式,让编程像“开挂”一样简单

飞算JavaAI提供智能会话的能力,支持智能问答、Javachat、智能体三种模式,不仅可以为开发者解决开发过程中的问题,同时系统具备代码智能生成、多维度上下文关联、版本快照回溯等核心能力,覆盖需求分析、代码优化、缺陷修复等典型研…

作者头像 李华
网站建设 2026/6/15 14:16:02

AI降重的技术本质:从困惑度到语义重构,一文读懂降AI率的底层逻辑

AI降重的技术本质:从困惑度到语义重构,一文读懂降AI率的底层逻辑 TL;DR: 降AI率的核心原理是调整文本的「困惑度」(Perplexity)和「突变性」(Burstiness)这两个关键指标。AI生成的内容困惑度低、突变性差,而人类写作恰恰相反。专业降AI工具通…

作者头像 李华
网站建设 2026/6/6 23:05:08

论文AI率太高怎么办?这5款神器帮你秒降到5%

论文AI率太高怎么办?这5款神器帮你秒降到5% TL;DR 论文AI率太高是2026年毕业生的普遍痛点,大多数高校要求AI率低于15%。本文推荐5款亲测有效的降AI工具,其中嘎嘎降AI可将AI率从62.7%降至5.8%,比话降AI承诺知网AI率降至15%以下且…

作者头像 李华