news 2026/6/16 21:03:07

深度学习论文: ICPR 2026 Competition on Low-Resolution License Plate Recognition

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
深度学习论文: ICPR 2026 Competition on Low-Resolution License Plate Recognition

深度学习论文: ICPR 2026 Competition on Low-Resolution License Plate Recognition
ICPR 2026 Competition on Low-Resolution License Plate Recognition
PDF: https://arxiv.org/abs/2604.22506
PyTorch代码: https://github.com/shanglianlm0525/CvPytorch
PyTorch代码: https://github.com/shanglianlm0525/PyTorch-Networks

1 概述

自动车牌识别(ALPR)系统在交通执法、电子收费等场景中应用广泛。在标准成像条件下,车牌检测与识别性能已趋于饱和。然而,在真实监控环境中,由于摄像头距离远、硬件限制以及强压缩,车牌图像常常以低分辨率(Low-Resolution, LR)获取,字符模糊、失真,识别难度显著增加。尽管实际需求迫切,低分辨率车牌识别(LRLPR)仍是一个极具挑战且研究不足的问题,现有最先进方法在真实低质量图像上的识别率也仅为50-60%。

为了推动该领域发展,本文在ICPR 2026上组织了首届低分辨率车牌识别竞赛。竞赛基于LRLPR-26数据集,该数据集包含20,000个训练轨迹(每个轨迹含同一车牌的5张低分图和5张高分图)和3,000个测试轨迹(每个轨迹含5张低分图)。这是目前最大的真实低分与高分车牌配对数据集。

竞赛吸引了来自41个国家的269支队伍,最终99支队伍提交了有效结果。本文介绍了竞赛概况、数据集、评估协议、结果,并详细分析了前五名团队的方法。

2 竞赛详细说明

组织者利用 YOLOv11 进行车牌检测,并使用 BoT-SORT 进行跨帧跟踪。对于同一辆车,远处的帧被标记为 LR 样本,近处的帧则作为高分辨率(High-Resolution, HR)参考。最终的标注通过对 5 帧 HR 图像进行 OCR 识别并结合多数投票(Majority Voting)机制产生,确保了 Ground Truth 的准确性。

2.1 训练数据

  • 20,000个轨迹,每个轨迹包含:
    • 5张连续的低分辨率(LR)车牌图像
    • 5张连续的高分辨率(HR)车牌图像

  • 总计200,000张图像。
  • 数据分为两个场景:
    • 场景A(10,000轨迹):相对受控环境(白天、无雨)。
    • 场景B(10,000轨迹):更具挑战性(雨天、夜间、不同方向)。
  • 车牌布局:
    • 巴西样式:3字母 + 4数字
    • Mercosur样式:3字母 + 1数字 + 1字母 + 2数字


训练集提供了HR图像,鼓励参赛者探索超分辨率等增强策略。

2.2 测试数据

  • 3,000个轨迹,全部来自场景B,每个轨迹对应唯一车辆。
  • 每个轨迹仅包含5张LR图像(无HR图像,无标注)。
  • 布局分布:600轨迹巴西样式,2,400轨迹Mercosur样式。

2.3 竞赛阶段与提交格式

  • 公开测试阶段(约1个月):
    • 提供1,000个测试轨迹(含部分标签用于反馈)。
    • 每日最多5次提交,总计最多25次。
    • 公共排行榜。
  • 盲测阶段(约1周):
    • 完整3,000个测试轨迹。
    • 排行榜私密,仅能看见自己分数。
    • 每个队伍总计最多3次提交。
  • 提交格式:每行track_id,plate_text;confidence

2.4 评估协议

  • 主要指标:识别率(Recognition Rate)
    • 定义:正确识别的轨迹数 / 总测试轨迹数
    • 要求预测车牌字符串与真实标签完全匹配。
  • 次要指标(用于平局时):置信度差距(Confidence Gap)
    • 正确预测的平均置信度 − 错误预测的平均置信度
    • 值越大,模型置信度校准越好。

竞赛结果概览

  • 第一名:识别率82.13%,置信度差距 6.67%
  • 第二名:81.73%
  • 第三名:80.17%
  • 第四名:80.10%
  • 第五名:79.83%

3 前五名团队方案详解

🥇 第一名:DLmath(韩国大学)

核心方法:教师-学生框架,联合训练超分辨率模型和OCR模型。

输入为5 帧低分辨率(LR)图像,输出为最终车牌识别文本。

核心逻辑:框架联合训练超分辨率(SR)模型与车牌 OCR 识别模型。学生分支以 LR 图像作为输入进行特征学习;教师分支基于指数移动平均(EMA) 动态更新权重,以降采样后的高分辨率(HR)图像作为监督信号,引导学生分支完成超分特征拟合。

模型组件:超分骨干选用 HATFIR 与 MambaIRv2;OCR 识别模块采用 GP-LPR。推理阶段采用后期融合策略,将 5 帧图像输出的预测 Logits 加权求和后再解码,有效提升车牌识别的鲁棒性与稳定性。

🥈 第二名:AIO_JiangnamCoffee(越南)


核心方法:四阶段识别流程 + 多模型集成。

  • 空间变换(Spatial Transformer Network, STN):用于对齐倾斜的车牌。
  • 特征提取:使用 SE-ResNet34-C 捕捉关键特征。
  • 序列建模:引入 Transformer 编码器。
  • 预测:采用连接时序分类(Connectionist Temporal Classification, CTC)损失进行解码。

特别设计了一个 CNN 注意力模块来评估每帧的质量,并对 5 帧特征进行加权融合。

🥉 第三名:OpenOCR(中国)

核心方法:低分辨率车牌识别作为鲁棒场景文本识别问题,不显式使用超分辨率。
将问题视为鲁棒场景文本识别,使用了 SVTRv2 架构。没有使用显式的超分模块,而是通过字符级投票机制整合 20 个预测结果(5 帧 × 4 个模型),展现了强力 Backbone 的优势。

第四名:CAP2(韩国)

核心方法:几何感知预处理 + 双流识别 + 位置感知集成。

利用 U-Net 生成文本区域掩码进行背景抑制,并结合 DINOv3 等强力特征提取器进行双流识别。

第五名:UIT-MeoBeo(越南)

核心方法:多阶段、多帧OCR管道 + 结构感知解码。

引入了时序 Transformer 进行跨帧融合,并根据巴西和南方共同市场(Mercosur)的车牌布局(如“三字母+一数字+一字母+两数字”)进行约束解码。

5 总结与讨论

  • 竞争激烈:前20名识别率仅差5.66个百分点,第一名错误率仍达17.87%,表明任务远未解决。
  • 方法多样性:没有单一主导架构,不同团队在超分辨率、直接识别、多帧融合、集成、布局约束等方面各有侧重。
  • 多帧利用是关键:几乎所有顶级方案都有效利用了5帧轨迹结构(投票、融合、时序建模)。
  • 置信度差距很重要:识别率相近时,置信度差距差异大,影响实际应用中的可靠性。
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/16 21:00:34

如何选择AI写论文工具?

本科生、研究生写论文常陷文献难找、逻辑混乱、查重超标、AI幻觉等困境,盲目用AI工具还易触碰学术诚信红线。本文结合学术规范、查重要求、功能适配与数据安全,实测AI论文工具,帮你精准选对合规高效的写作助手。一、先守学术合规底线&#xf…

作者头像 李华
网站建设 2026/5/12 21:38:10

Python 爬虫反爬突破:动态脚本加载拦截与解析

前言 现代主流网站全面采用 Vue、React、Angular 等前端框架实现前后端分离,核心数据不再直埋页面源码,而是依托动态 JS 脚本异步渲染、路由懒加载、脚本分片加载、Webpack 代码打包、异步接口动态挂载等机制完成数据展示。传统爬虫直接请求页面源码只能…

作者头像 李华
网站建设 2026/5/12 21:35:20

2026届最火的六大降AI率助手实测分析

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 关键是要破除机械化生成痕迹,给文本注入具有人类创作特性的不规则性以及情境感&…

作者头像 李华
网站建设 2026/5/12 21:35:19

独立开发者如何借助Taotoken快速构建多模型支持的AI应用

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 独立开发者如何借助Taotoken快速构建多模型支持的AI应用 对于独立开发者或小型工作室而言,构建一个具备AI能力的应用&a…

作者头像 李华
网站建设 2026/5/12 21:31:04

如何从 iPhone 中删除私人号码?

使用 iPhone 拨打电话时,您有时可能会发现您的来电显示显示为“私人号码”。这可能会导致您的联系人无法识别您的呼叫,导致接听者感到困惑,并可能影响您的沟通效率。不用担心,本文将提供有关如何从 iPhone 中删除私人号码的详细指…

作者头像 李华
网站建设 2026/5/12 21:28:09

告别黑屏!手把手教你用C# WPF + EmguCV搞定本地摄像头和RTSP视频流播放

实战指南:C# WPF与EmguCV实现高稳定视频流处理方案 在开发安防监控、远程教学或视频会议系统时,视频流的稳定播放往往是第一个技术门槛。许多开发者在使用WPF集成EmguCV处理视频流时,都遭遇过黑屏、卡顿或崩溃的问题。本文将深入剖析这些常见…

作者头像 李华