news 2026/6/15 15:45:39

公共区域传单分发检测数据集(YOLO格式)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
公共区域传单分发检测数据集(YOLO格式)

摘要:本数据集是一个专门针对公共区域发传单行为的目标检测数据集,包含 3,443 张真实场景图像和 6,886 个精确标注框。 数据集采用 YOLO 格式标注,涵盖 person(人员)和 leaflet(传单)两个核心类别, 旨在支持公共空间中人员与传单交互行为的智能识别与分析。

作者:Bob (张家梁)
数据大小:6G
原创声明:本项目为原创作品

数据集简介

一个包含 3,443 张真实场景图像的 YOLO 格式目标检测数据集,用于识别公共区域中的人员与传单交互行为。

数据集概述

本数据集是一个专门针对公共区域发传单行为的目标检测数据集,包含 3,443 张真实场景图像和 6,886 个精确标注框。 数据集采用 YOLO 格式标注,涵盖 person(人员)和 leaflet(传单)两个核心类别, 旨在支持公共空间中人员与传单交互行为的智能识别与分析。

数据来源于商业街、广场、步行区等多样化公共通行区域的现场采集,覆盖不同光照条件、背景复杂度和遮挡程度, 确保模型在真实部署环境中的鲁棒性与泛化能力。数据集按照 70% / 20% / 10% 的比例划分为训练集(2,410 张)、 验证集(688 张)和测试集(345 张),并经过双阶段质量控制流程,保证标注的准确性与一致性。

该数据集适用于基于 YOLOv13 及其他 YOLO 系列模型的目标检测任务,可为城市管理、公共安全监控、 行为分析等领域的计算机视觉应用提供高质量训练数据支持。推荐使用 mAP@0.5 和 mAP@0.5:0.95 等标准指标进行模型评估, 并分别报告各类别的检测性能。

数据集来源

本数据集来源于真实公共空间的现场采集图像,覆盖人员与传单的 多样化出现形态。场景包含公共通行区域(如机场区域等) 的人群交互情形,具有不同光照、背景复杂度与遮挡程度,以增强模型 对实际部署环境的泛化能力。

类别定义

标注规范

标注采用 YOLO 格式:每个目标一行,字段为 class x_center y_center width height, 坐标均为相对归一化(0~1)。

图1 标注规范图

数据规模与划分

  • 总图像数:3443;总标注框数:6886

图2 数据集在训练、验证和测试集上的分布

数据集按照约 70:20:10 的比例划分为训练集、验证集和测试集:

表1 数据集划分及用途说明

质量控制

标注采用双阶段质量控制流程:首先进行规范化标注与自检, 确保目标框贴合实例外接矩形且类别一致;随后进行抽样复核, 针对漏标、错标与框位置偏差进行纠正。对争议样本进行二次确认, 以提高跨标注者一致性与总体标注可靠性。

数据格式与使用

数据集采用标准 YOLO 格式组织,通过 data.yaml 配置文件即可快速集成到训练流程中。

目录结构

数据集采用标准 YOLO 格式组织,图像和标注文件分别存放在 images/ 和 labels/ 目录下,并按训练集、验证集、测试集划分。

使用方式

在训练脚本中指定 data.yaml 即可加载数据:

示例展示

数据集包含多种典型场景的标注样本:

性能评测

基于 YOLOv11 模型在本数据集上进行训练和评测,使用mAP@0.5与mAP@0.5:0.95等标准指标对模型检测效果进行评估。评测结果如下:

训练过程综合指标曲线图

图3 训练与验证指标随Epoch变化趋势图

精确率-召回率(PR)曲线图

图4 目标检测PR曲线(Precision-Recall)

F1分数-置信度阈值曲线图

图5 不同置信度阈值下的F1曲线

归一化混淆矩阵图(分类误判分析)

图6 归一化混淆矩阵(person / leaflet)

应用案例

  • 案例1:基于多尺度深度卷积增强的YOLO11公共区域发传单违规行为检测系统

图7 应用案例:基于多尺度深度卷积增强的YOLO11公共区域发传单违规行为检测系统

免责声明与引用

数据仅用于科研与教学用途。若用于商业场景,请自行核验数据许可。 如需引用,请在论文或报告中注明数据集名称与版本号。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 13:25:31

使用MCP执行代码:让Agent效率提升98.7%

Anthropic推出的Model Context Protocol (MCP)面临大规模工具连接的性能瓶颈。通过将MCP服务器呈现为代码API,实现了98.7%的token使用率降低。这一创新架构实现了五大优势:渐进式工具披露、高效数据处理、强大控制流、隐私保护和状态持久化,使…

作者头像 李华
网站建设 2026/6/15 12:21:46

基于大数据+Hadoop的多维度用户画像构建与个性化推荐应用研究开题报告

基于大数据Hadoop的多维度用户画像构建与个性化推荐应用研究开题报告 一、研究背景与意义 (一)研究背景 在大数据与人工智能技术飞速迭代的当下,数字内容消费已进入个性化时代。各类互联网平台(资讯、电商、短视频、社交&#xff…

作者头像 李华
网站建设 2026/6/15 13:22:49

大数据爬虫+Hadoop+微博舆情分析可视化系统任务书

大数据爬虫Hadoop微博舆情分析可视化系统任务书 一、任务名称 基于大数据爬虫、Hadoop的微博舆情分析可视化系统开发 二、任务目的 本任务旨在开发一套集微博数据采集、存储、分析与可视化于一体的舆情分析系统。通过大数据爬虫技术精准抓取微博平台公开数据,依托Ha…

作者头像 李华
网站建设 2026/6/15 14:37:03

audio2face gRPC 服务 10246

10246 常见端口对应关系(不同版本略有差异) 5008:REST / HTTP 控制接口(你之前问过的) 10246:实时流 / gRPC / Stream(驱动表情用得最多) 测试端口: netstat -ano | f…

作者头像 李华
网站建设 2026/6/15 13:14:45

生成引擎优化(GEO)提升在线内容传播效率的探索与实践

生成引擎优化(GEO)的目的是通过分析用户的需求和搜索引擎的规则,提升在线内容的传播效率。内容创作者需要深入理解目标受众的期望,以确保所创作的内容精准匹配用户搜索意图。GEO倡导将核心关键词自然融入文章中,这不仅提高了搜索引擎的可见性…

作者头像 李华