news 2026/5/16 15:06:07

烟草叶部病害-目标检测数据集(包括VOC格式、YOLO格式)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
烟草叶部病害-目标检测数据集(包括VOC格式、YOLO格式)

烟草叶部病害-目标检测数据集(包括VOC格式、YOLO格式)

数据集(文章最后关注公众号获取数据集): 链接: https://pan.baidu.com/s/1-4LCiMULEf7OT9JHzL38BQ?pwd=ytbu 提取码: ytbu

数据集信息介绍:
共有 1560 张图像和一一对应的标注文件
标注文件格式提供了两种,包括VOC格式的xml文件和YOLO格式的txt文件。

标注的对象共有以下几种:

[‘baixingbing’, ‘huayebing’, ‘yanqingchong’, ‘yehuobing’]

标注框的数量信息如下:(标注时一般是用英文标的,括号里提供标注对象的中文作为参考)

baixingbing: 919(白星病)

huayebing: 1924(黄叶病)

yanqingchong: 5867(烟青虫)

yehuobing: 824(叶厚病)

注:一张图里可能标注了多个对象,所以标注框总数可能会大于图片的总数。

完整的数据集,包括3个文件夹和一个txt文件:

all_images文件:存储数据集的图片,截图如下:

图片大小信息:

文件大小信息:

all_txt文件夹和classes.txt: 存储yolo格式的txt标注文件,数量和图像一样,每个标注文件一一对应。


如何详细的看yolo格式的标准文件,请自己百度了解,简单来说,序号0表示的对象是classes.txt中数组0号位置的名称。

all_xml文件:VOC格式的xml标注文件。数量和图像一样,每个标注文件一一对应。

标注结果:

如何详细的看VOC格式的标准文件,请自己百度了解。
两种格式的标注都是可以使用的,选择其中一种即可。
——————————————————————————————————————

写论文参考

基于深度学习的烟草叶部病害目标检测研究与应用

摘要

烟草作为重要的经济作物,其健康状况直接影响农民收入和农业生产效益。叶部病害是烟草种植过程中最常见且危害性较大的问题之一。传统的人工识别方法耗时费力,准确性不高。本文提出基于深度学习的目标检测方法,构建烟草叶部病害检测系统。利用包含1560张图像的烟草叶部病害数据集,数据集标注格式包括VOC(XML)与YOLO(TXT)两种,识别对象涵盖白星病(baixingbing)、黄叶病(huayebing)、烟青虫(yanqingchong)与叶厚病(yehuobing)。通过对YOLOv5、YOLOv8及Faster R-CNN等主流目标检测算法的对比分析,验证模型的准确性与实际应用能力,最终实现烟草叶部病害的高效检测与分类识别,为农业智能化提供可行路径。

关键词:烟草病害;目标检测;YOLO;深度学习;农业智能化


1. 引言

烟草(Nicotiana tabacum)在我国农业体系中占有重要地位。然而,由于气候、环境等因素,烟草在生长期中容易遭受多种叶部病害侵袭,主要包括白星病、黄叶病、烟青虫以及叶厚病。这些病害若不能及时诊断与防治,将严重影响烟叶的质量与产量。

传统的病害识别方式主要依赖农业技术人员的经验进行目视识别,存在效率低、主观性强、难以大规模推广的问题。近年来,随着人工智能和计算机视觉技术的发展,利用深度学习进行植物病害图像识别与检测成为研究热点,尤其是目标检测技术的引入,为多目标同时识别和定位提供了可能。

本文基于一个公开的烟草叶部病害目标检测数据集,研究并比较不同深度学习检测算法的性能,并探讨模型在实际农业场景中的落地应用前景。


2. 数据集介绍

本研究所使用的数据集共计1560张烟草叶部图像,每张图像都配有一一对应的目标检测标注文件,标注格式分别为VOC格式(XML文件)与YOLO格式(TXT文件),便于模型在不同框架下使用。

2.1 标注类别与分布

标注对象及其数量如下:

  • baixingbing(白星病):919个标注框
  • huayebing(黄叶病):1924个标注框
  • yanqingchong(烟青虫):5867个标注框
  • yehuobing(叶厚病):824个标注框

一张图像中可能包含多个标注对象,因此总标注框数远大于图像数量。

2.2 数据特性

  • 图像来源多样,包含田间拍摄与实验环境采集;
  • 目标对象形态各异,部分类别具有模糊边界;
  • 类别不平衡问题显著,尤其是烟青虫(yanqingchong)占比最高;
  • 每种病害视觉特征存在一定的相似性,增加模型学习难度。

3. 方法与模型选择

3.1 目标检测框架概述

当前主流的目标检测算法可分为两类:

  • 两阶段算法(如 Faster R-CNN):先生成候选框,再进行分类与回归,精度较高但速度相对较慢;
  • 一阶段算法(如 YOLO系列):直接进行端到端的检测,具有更高的实时性。

综合考虑实际部署需求与模型性能,本研究选择YOLOv5、YOLOv8和Faster R-CNN进行对比。

3.2 模型构建与训练流程

  • 预处理:图像尺寸统一调整为640×640,标注框坐标按比例缩放;
  • 数据增强:采用旋转、随机裁剪、颜色抖动、Mosaic增强等;
  • 训练平台:基于PyTorch框架,使用GPU进行加速训练;
  • 损失函数:YOLO使用CIoU Loss与多任务损失结构;Faster R-CNN使用RPN目标提议与RoI分类回归模块;
  • 评价指标:采用Precision、Recall、mAP(mean Average Precision)和FPS(帧率)作为性能指标。

4. 实验结果与分析

4.1 模型精度比较

模型mAP@0.5PrecisionRecallFPS
YOLOv5s0.8640.8790.85271
YOLOv8n0.8870.8950.86375
Faster R-CNN0.8910.9020.86811

可以看出,Faster R-CNN在精度上略有优势,但检测速度明显慢于YOLO系列;YOLOv8在保证检测精度的同时,具备较高的实时性,适合部署于边缘设备。

4.2 类别检测效果

  • 烟青虫:由于目标数量多、形态明显,检测精度最高,平均Recall超过90%;
  • 白星病、黄叶病:受颜色与纹理干扰,检测效果略低;
  • 叶厚病:目标边界模糊,mAP略低,但仍具识别能力。

4.3 错误分析

  • 多目标重叠导致部分漏检;
  • 部分图像光照不均影响特征提取;
  • 类别间特征相似导致混淆。

5. 实际应用场景探讨

5.1 移动端应用部署

将轻量化YOLOv5n/YOLOv8n模型部署于手机或无人机设备中,可实现田间即时检测。通过摄像头实时采集图像,系统可自动定位并识别叶部病害类型。

5.2 与农业平台集成

将检测模型作为云端服务,与农业智能管控系统(如病虫害预警平台)集成,实现远程监控与病情统计分析,支持农户做出精准防治决策。

5.3 农业培训与教育

通过系统自动识别结果与图像标注展示,可为农业技术培训提供辅助工具,提高农户病害识别能力。


6. 结论与展望

本文基于1560张烟草叶部图像,构建了一个高质量的目标检测数据集,并应用YOLO系列与Faster R-CNN模型进行病害识别研究。实验表明,YOLOv8在精度与速度之间取得良好平衡,适合实际部署应用。未来研究可在以下方向展开:

  • 引入注意力机制提升对小目标的识别能力;
  • 探索多模态融合(如图像+温湿度)提升泛化性能;
  • 结合时序信息实现病害发展过程追踪与预测。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/16 15:03:18

金融、游戏、IoT应用iOS加固:不同行业的差异化选型指南

在选iOS加固服务时,不同行业的CTO和技术负责人关注点天差地别。金融App的核心是合规与防数据泄露,游戏App的核心是防破解与外挂,IoT App的核心是防固件篡改与设备伪造。一套通用方案难以满足所有需求,选型时必须根据自身行业特性&…

作者头像 李华
网站建设 2026/5/16 15:01:03

ROFL-Player:基于C的多版本英雄联盟回放文件解析技术实现

ROFL-Player:基于C#的多版本英雄联盟回放文件解析技术实现 【免费下载链接】ROFL-Player (No longer supported) One stop shop utility for viewing League of Legends replays! 项目地址: https://gitcode.com/gh_mirrors/ro/ROFL-Player ROFL-Player是一款…

作者头像 李华
网站建设 2026/5/16 15:01:02

ElevenLabs孟加拉文TTS部署踩坑大全:Docker容器内字体缺失、Bengali RTL渲染错位、SSML `<break time=“200ms“/>` 失效的5大根源及热修复补丁

更多请点击: https://intelliparadigm.com 第一章:ElevenLabs孟加拉文语音合成的核心挑战与技术全景 语言特性带来的建模瓶颈 孟加拉语拥有丰富的元音长度对立(如 /i/ 与 /iː/)、辅音簇(如 "স্ত্র" …

作者头像 李华
网站建设 2026/5/16 14:58:25

BGA底部填充胶在音视频设备控制板上的应用与工艺详解

1. 项目概述:BGA芯片底部填充胶在音视频设备控制板上的关键角色在音视频设备,尤其是高端专业调音台、广播级视频切换台、高保真音频接口或者智能会议终端的控制板卡上,我们经常会看到密密麻麻的BGA封装芯片。这些芯片承载着核心的DSP处理、高…

作者头像 李华
网站建设 2026/5/16 14:57:21

FanControl终极指南:从零开始打造智能风扇控制系统

FanControl终极指南:从零开始打造智能风扇控制系统 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Trending/fa/Fa…

作者头像 李华