一、从产线误检说起
上周产线反馈了个头疼的问题:同一套RT-DETR模型,在测试环境里mAP能到89.2%,上了产线检测小尺寸工件时,误检率突然飙升。
现场工程师把视频流截了几段发我,一看就明白了——测试集用的是1920×1080分辨率,但产线摄像头为了拍清细小零件,实际输出是2560×1440,而且工件在画面中的尺度变化比测试集大得多。
这其实是个经典问题:模型在固定分辨率上训练,遇到尺度分布差异大的数据就“懵了”。想起早年做YOLO系列时也踩过这个坑,当时靠的是多尺度训练(Multi-Scale Training)硬扛过去的。今天咱们就聊聊怎么让RT-DETR也具备这种尺度鲁棒性。
二、多尺度训练不是简单的resize
很多人以为多尺度训练就是每批次随机选个尺寸,把图片缩放了扔进网络。如果真这么干,RT-DETR的性能反而可能下降。为什么?因为它的跨尺度特征融合机制对输入尺度很敏感。
# 错误示范:别这样写!defrandom_resize(image,target_size