news 2026/5/1 5:10:12

只需一张图,无需训练、无需先验、无需提示、类别无关!这个通用物体计数模型即将开源!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
只需一张图,无需训练、无需先验、无需提示、类别无关!这个通用物体计数模型即将开源!

原文链接:真正类别无关的、理想的、可用于全自动物体计数系统的解决方案。

在智能交通系统中,算法需实时监测不同区域的人流、车流密度。在工业流水线上,模型要快速清点成千上万个形态各异的零件。

看似简单的计数任务,实则涉及物体识别、定位与区分。当然,目前来讲类别特定的物体计数已经非常成熟。

只要能够为每个物体类别获取足够大的带标注训练数据集,这些计数模型就可以可靠地计数属于单个预定类别的大量物体。

如何应对新增类别的需求?这是在真实场景中我们需要应对的方向:开放词汇目标计数!旨在统计图像中任意类别物体的实例数量。

现有大模型方法大多假设每张图像中仅存在一个物体类别,其依赖额外的输入(如视觉示例或文本提示)来指定应计数的物体。

那能否不借助任何辅助信息及训练,仅通过一张图像,就能统计任意类别物体的实例数量呢?今天介绍的OCCAM框架是真正类别无关的、理想的、可用于全自动物体计数系统的、以及目前最通用的解决方案。

原文链接:真正类别无关的、理想的、可用于全自动物体计数系统的解决方案。

# PaperClass-Agnostic, Training-Free, Prior-Free and Multi-Class Object Counting# Arxivhttps://arxiv.org/pdf/2601.13871# Codehttps://mikespanak.github.io/OCCAM_counter/

一、类别无关计数的三大流派

现有的类别无关计数方法可以根据以下几点进行分类:是否依赖先验信息、是否需要专门训练以及是否支持多类别计数。

1. 先验依赖型

先验依赖型方法是类别无关计数领域的开山鼻祖,也是目前最成熟的技术路线。核心思路很简单:既然AI不知道要数什么,那就明确告诉它,给模型提供示例物体、文本描述或点标注。

基于示例的方法通过给定图像中的1-3个实例提供最强的指导,代表性的工作PseCo 将SAM的通用分割能力与CLIP的语义理解能力相结合。

2. 无需训练型

无需训练的方法旨在通过利用基础模型来克服对训练数据的需求,之前文章中介绍过的 CountingDINO 依赖完全无监督的DINOv2特征来提取潜在物体原型并生成基于相似性的密度图。

3. 多类别全能型

现实世界的图像很少只包含一类物体,多类别全能型方法旨在一次性解决所有类别物体的计数问题。

ABC123是首个多类别计数框架,它是一种基于Transformer的密度回归方法,能够在无需先验的情况下同时计数多种物体类型。每个物体类别最多可以有300个实例,且每张图像最多只能计数4个不同类别。

二、三个基础突破定义通用计数新标准

一张野外观测照片中可能有羚羊、斑马、树木和岩石,无论是稀疏分布还是密集排列。OCCAM 都能一次性给出每类物体的准确数量,且其实例数量没有上限。

如何实现无需训练?查看原文链接:真正类别无关的、理想的、可用于全自动物体计数系统的解决方案。https://mp.weixin.qq.com/s/Dw7J-MFiwcHoJ1NxgG0ljg

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/20 9:20:36

Java基于SSM+JSP的词语查询系统

项目说明 成语,作为汉语语言文化中的瑰宝,承载着深厚的历史底蕴与文化内涵。随着互联网技术的发展,传统的成语学习方式已经无法满足现代人的需求,而成语查询系统的开发则具有深远的意义。它不仅为人们提供了一个便捷、高效的成语…

作者头像 李华
网站建设 2026/4/27 1:40:49

Java基于Spring Boot+Vue的智能社区服务与管理平台的设计与实现

所需该项目可以在最下面查看联系方式,为防止迷路可以收藏文章,以防后期找不到 项目介绍 随着城市化进程的加快,社区作为城市生活的基本单元,其管理和服务水平直接影响到居民的生活质量和城市的整体形象。然而,传统的…

作者头像 李华
网站建设 2026/4/26 6:19:01

InfluxDB迁移?时序数据库国产替代三大难点与实践

2024年信创目录已覆盖超80%的中央企业,国产数据库正加速进入各行业核心业务系统。在工业互联网、物联网等场景中,设备传感器带来的时序数据呈现爆发式增长,“能否实现对InfluxDB的国产化替代?”成为政企单位在技术选型中的关键议题…

作者头像 李华
网站建设 2026/4/24 10:14:59

基于物联网的人体监护仪设计

阅读提示 博主是一位拥有多年毕设经验的技术人员,如果本选题不适用于您的专业或者已选题目,我们同样支持按需求定做项目,论文全套!!! 博主介绍 CSDN毕设辅导第一人、靠谱第一人、全网粉丝50W,csdn特邀作者…

作者头像 李华
网站建设 2026/4/30 2:46:25

小红书评论数据一键获取,item_reviewAPI接口讲解

小红书评论数据获取可通过官方API接口实现,其中item_review API是核心工具,以下从接口特性、调用流程、数据结构、合规要点四方面系统解析:1. 接口特性与能力核心功能:获取指定笔记的评论列表(含子评论回复&#xff09…

作者头像 李华