news 2026/4/30 15:44:35

行人检测十年演进(2015–2025)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
行人检测十年演进(2015–2025)

行人检测十年演进(2015–2025)

一句话总论:
2015年行人检测还是“手工HOG特征+滑动窗口+SVM分类”的传统时代,2025年已进化成“万亿级多模态VLA端到端统一检测+实时4D动态意图理解+量子鲁棒自进化”的具身智能时代,中国从跟随HOG/DPM跃升全球领跑者(华为、小鹏、地平线、Momenta、旷视等主导),mAP从Caltech~50–60%飙升至>98%全场景零样本,实时性从离线到毫秒级,支持全天气/遮挡/社交意图,推动智驾/安防/机器人从“框出人”到“像人一样实时理解行人动态意图”的文明跃迁。

十年演进时间线总结
年份核心范式跃迁代表算法/模型mAP (Caltech/Citypersons) / FPS实时性/鲁棒性中国贡献/里程碑
2015手工特征+滑动窗口HOG + SVM / DPM~50–60% / <5 FPS离线 / 简单场景HOG/DPM经典,中国初代安防行人检测
2017CNN两阶段初探Faster R-CNN + FPN~70–75% / 准实时初步多尺度旷视/商汤初代CNN行人检测
2019单阶段+小目标优化爆发CSP / RetinaNet~80–85% / 实时初探遮挡/小目标初步Momenta/地平线车载行人检测量产
2021Transformer+多模态初探DETR / Swin Pedestrian~88–92% / 实时长距离/少样本小鹏NGP + 华为ADS 2.0 Transformer行人首发
2023端到端多模态+VLA元年UniAD / Occ-Ped / VLA Detect~93–96% / 毫秒级动态意图+零样本小鹏XNGP + 华为ADS 3.0端到端行人首发
2025VLA自进化+量子鲁棒终极形态Grok-4 Ped / DeepSeek-Ped>98% / 亚毫秒级量子鲁棒全域社交意图+自进化华为ADS 4.0 + 小鹏第二代VLA + 比亚迪天神之眼行人
1.2015–2018:手工特征+CNN两阶段时代
  • 核心特征:行人检测以手工HOG/DPM+滑动窗口或早期CNN两阶段(Faster R-CNN)为主,mAP~50–75%,离线/准实时,主要正面/无遮挡场景。
  • 关键进展
    • 2015年:HOG+SVM/Caltech数据集经典。
    • 2016–2017年:Faster R-CNN+FPN多尺度。
    • 2018年:初步小目标优化,中国旷视/商汤安防行人检测。
  • 挑战与转折:遮挡/小目标弱;单阶段+实时需求爆发。
  • 代表案例:Caltech行人基准,中国初代产业应用。
2.2019–2022:单阶段实时+Transformer时代
  • 核心特征:CSP/RetinaNet单阶段+Transformer(DETR/Swin)全局建模,实时FPS>30,mAP~80–92%,支持遮挡/小目标/多模态初步。
  • 关键进展
    • 2019年:CSP小目标专用+CenterNet。
    • 2020–2021年:DETR Transformer检测+Swin ViT骨干。
    • 2022年:地平线征程+Momenta车载实时行人检测。
  • 挑战与转折:动态/意图弱;端到端多模态VLA兴起。
  • 代表案例:小鹏NGP + 华为ADS 2.0实时行人检测。
3.2023–2025:端到端VLA自进化时代
  • 核心特征:端到端VLA大模型统一行人检测+跟踪+意图预测+占用网格融合+量子鲁棒自进化,毫秒级全场景社交意图行人理解。
  • 关键进展
    • 2023年:UniAD/Occ-Ped端到端+VLA行人意图。
    • 2024年:DeepSeek/Grok-4专用行人检测,量子混合精度。
    • 2025年:华为ADS 4.0 + 小鹏第二代VLA + 比亚迪天神之眼,全天气动态社交行人检测,普惠7万级。
  • 挑战与转折:黑箱/极端环境;量子+大模型自进化标配。
  • 代表案例:比亚迪天神之眼(7万级全天气动态行人意图),银河通用2025人形(VLA社交行人意图理解)。
一句话总结

从2015年HOG手工特征的“框出正面行人”到2025年VLA量子自进化的“全域动态社交行人意图大脑”,十年间行人检测算法由规则模块转向多模态语义闭环,中国主导CSP→Transformer→VLA行人创新+普惠下沉,推动智驾/安防/机器人从“静态行人检测”到“像人一样实时理解行人动态意图”的文明跃迁,预计2030年行人检测精度>99.99%+全域永不失真自愈。

数据来源于arXiv综述、IROS 2025及中国厂商技术白皮书。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 6:14:41

避障十年演进(2015–2025)

避障十年演进&#xff08;2015–2025&#xff09; 一句话总论&#xff1a; 2015年避障还是“2D激光网格规则膨胀反应式A*路径”的刚性时代&#xff0c;2025年已进化成“万亿级多模态VLA端到端4D动态避障实时意图级社交博弈量子鲁棒自愈全域永不碰撞”的具身智能时代&#xff0c…

作者头像 李华
网站建设 2026/5/1 4:59:53

Protocol Buffers 编码原理深度解析

在网络通信和数据存储领域&#xff0c;序列化技术的选择直接影响到系统的性能、可扩展性和维护成本。在众多序列化方案中&#xff0c;Google的Protocol Buffers&#xff08;简称Protobuf&#xff09;凭借其高效的二进制编码、卓越的向前/向后兼容性以及简洁的接口定义语言&…

作者头像 李华
网站建设 2026/5/1 7:16:51

高频信号处理篇---电阻、电容、电感

低频状态&#xff1a;一、电阻&#xff08;R&#xff09;—— 像“水管里的海绵”作用&#xff1a;阻碍电流&#xff0c;消耗电能变热。 单位&#xff1a;欧姆&#xff08;Ω&#xff09;1. 串联&#xff08;首尾相连&#xff0c;一条路&#xff09;公式&#xff1a;总电阻 R总…

作者头像 李华
网站建设 2026/5/1 7:20:41

硬盘结构转换交互式网页终极指南:让文件管理变得如此简单

硬盘结构转换交互式网页终极指南&#xff1a;让文件管理变得如此简单 【免费下载链接】Snap2HTML Generates directory listings contained in a single, app-like HTML files 项目地址: https://gitcode.com/gh_mirrors/sn/Snap2HTML 还在为找不到文件而烦恼吗&#xf…

作者头像 李华