news 2026/6/15 21:53:16

<span class=“js_title_inner“>YOLO卷不动了,目标检测还能这样发论文!</span>

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
<span class=“js_title_inner“>YOLO卷不动了,目标检测还能这样发论文!</span>

YOLO实在卷不动了,不知道目标检测还有哪些baseline好用?不知道怎么选?

实际上DETR系列都是好选择,也一直很火。包括RT-DETR系列、DINO系列、D-FINE系列等,近来更是出现了很多新变体,像是DINOv3、RF-DETR……此外,RetinaNet、轻量化检测等,也是主流。而具体的选择,则需要结合任务的特点。比如速度要求高,可以选RT-DETR;精度要求高,可以考虑Co-DETR……

同时,想往这方向发论文的伙伴,还可以关注一些顶会新赛道:SAM+目标检测、Mamba+目标检测、扩散模型+目标检测、YOLO+多模态……纵观近2年的顶会,这些领域录用量都在上涨,且还不算卷!

为让大家能够紧跟领域前沿,早点发出自己的顶会,以上所提所有baseline和方向,我都给大家准备了配套的参考论文和源码,共145篇!

扫描下方二维码,回复「目检145」

免费获取全部论文合集及项目代码

RT-DETRv4: Painlessly Furthering Real-Time Object Detection with Vision Foundation Models

内容:这篇论文提出了RT-DETRv4,一个通过视觉基础模型(VFM)知识蒸馏来增强实时目标检测器的新框架。核心创新包括:1)深度语义注入器(DSI),将VFM的高层语义表示整合到检测器深层;2)梯度引导自适应调制(GAM),根据梯度范数比动态调整语义迁移强度。该方法在不增加推理开销的情况下,显著提升了DETR系列模型的性能,在COCO数据集上达到了新的SOTA水平。

D-FINED:REDEFINE REGRESSION TASK IN DETRS ASFINE-GRAINED DISTRIBUTION REFINEMENT

内容:这篇论文提出了D-FINE,一个通过重新定义DETR模型中边界框回归任务来实现出色定位精度的实时目标检测器。核心创新包括:1)细粒度分布细化(FDR),将回归过程从预测固定坐标转变为迭代细化概率分布,提供更精细的中间表示;2)全局最优定位自蒸馏(GO-LSD),通过自蒸馏将深层精炼的分布知识传递到浅层。该方法在COCO数据集上达到SOTA性能(D-FINE-X获得55.8% AP at 78 FPS),并能将各种DETR模型性能提升高达5.3% AP,且几乎不增加额外参数和训练成本。

扫描下方二维码,回复「目检145」

免费获取全部论文合集及项目代码

DEYOLO: Dual-Feature-Enhancement YOLO for Cross-Modality Object Detection

内容:这篇论文提出了DEYOLO,一种用于跨模态目标检测的双特征增强YOLO框架,专门解决低光照环境下的检测问题。核心创新包括:1)双语义增强通道权重分配模块(DECA)和双空间增强像素权重分配模块(DEPA),通过双重增强机制在特征空间聚合跨模态信息,减少两种模态间的相互干扰;2)双向解耦焦点机制,扩大骨干网络在不同方向的感受野。该方法在M3FD和LLVIP数据集上显著优于现有的融合检测方法,mAP50提升超过5%,且DECA和DEPA模块可作为即插即用组件应用于其他模型。

Mamba-YOLO-World: Marrying YOLO-World with Mamba for Open-Vocabulary Detection

内容:这篇论文提出了Mamba-YOLO-World,一种将YOLO-World与Mamba状态空间模型结合的开词汇目标检测方法。核心创新是MambaFusion路径聚合网络(MambaFusion-PAN),通过并行引导选择扫描(PGSS)和串行引导选择扫描(SGSS)算法,以线性复杂度O(N+1)实现全局引导感受野的多模态特征融合。实验表明,该方法在COCO和LVIS数据集上零样本和微调设置下均优于原始YOLO-World,在保持相当参数量和计算量的同时,AP提升0.4%-1.8%,且超越了现有开词汇检测SOTA方法。

扫描下方二维码,回复「目检145」

免费获取全部论文合集及项目代码


版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 14:59:15

深度测评8个降AIGC网站,千笔帮你轻松降AI率

AI降重工具:让论文更自然,更安心 在当今学术写作中,越来越多的学生开始使用AI工具辅助论文撰写。然而,随着各大高校对AIGC率的重视程度不断提升,如何有效降低AI痕迹、避免查重率过高,成为了许多学生面临的…

作者头像 李华
网站建设 2026/6/15 16:17:26

计算机四级嵌入式之操作系统原理(四)并发与同步

计算机四级嵌入式之操作系统原理(四)并发与同步 (全国计算机等级考试 四级嵌入式系统开发工程师 考点精讲,2026最新视角) NCRE 四级嵌入式系统开发工程师考试中,操作系统原理部分占分较大(通常…

作者头像 李华
网站建设 2026/6/15 16:33:15

【小程序毕设源码分享】基于springboot+小程序的川味游app的设计与实现(程序+文档+代码讲解+一条龙定制)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/6/15 15:16:14

C++ 输入输出流:cin 与 cout 的基础用法

C 输入输出流:cin 与 cout 的基础用法 在C编程中,输入输出(I/O)是最基础、最常用的功能之一——无论是接收用户输入的信息,还是向屏幕输出程序运行结果,都离不开输入输出流。前文我们学习了命名空间&#x…

作者头像 李华