news 2026/6/2 19:28:14

带标注的番茄西红柿病害和虫害检测数据集,可识别健康叶,8种虫害和9种病害,识别率86.6%,6639张图,支持yolo,coco json,voc xml,文末有模型训练代码

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
带标注的番茄西红柿病害和虫害检测数据集,可识别健康叶,8种虫害和9种病害,识别率86.6%,6639张图,支持yolo,coco json,voc xml,文末有模型训练代码


带标注的番茄西红柿病害和虫害检测数据集,可识别健康叶,8种虫害和9种病害,识别率86.6%,6639张图,支持yolo,coco json,voc xml,文末有模型训练代码

模型训练指标参数:

模型训练图:

数据集拆分

总图数:6639 张图数
训练集

5794 张图

验证集

544 张图

测试集

301 张图

预处理

自动定向:应用

调整大小:拉伸到266x266

增强

单样本输出数:3
90° 旋转:顺时针、逆时针、上下翻转
旋转角度:±15°
曝光调整:±5%

数据集标签:

[‘Bacterial Spot’, ‘Cotton Bollworm’, ‘Melon Thrips’, ‘Early Blight’, ‘Red Spider Mite’, ‘Leaf Mold’, ‘Green Peach Aphid’, ‘Two-spotted Spider Mite’, ‘Late Blight’, ‘Melon Fly’, ‘Target Spot’, ‘Septoria Leaf Spot’, ‘Greenhouse Whitefly’, ‘Mosaic Virus’, ‘Yellow Leaf Curl Virus’, ‘Tobacco Caterpillar’, ‘Healthy’, ‘Beet Armyworm’]

标签解释:

英文名称中文译名
Healthy健康植株
Bacterial Spot细菌性斑点病
Beet Armyworm甜菜夜蛾
Cotton Bollworm棉铃虫
Early Blight早疫病
Green Peach Aphid桃蚜(桃绿蚜)
Greenhouse Whitefly温室白粉虱
Late Blight晚疫病
Leaf Mold叶霉病
Melon Fly瓜实蝇
Melon Thrips瓜蓟马
Mosaic Virus花叶病毒病
Red Spider Mite红蜘蛛
Septoria Leaf Spot斑枯病(壳针孢叶斑病)
Target Spot靶斑病
Tobacco Caterpillar烟青虫
Two-spotted Spider Mite二斑叶螨
Yellow Leaf Curl Virus黄化曲叶病毒病

数据集图片和标注信息示例:

数据集下载:

yolo26:https://download.csdn.net/download/pbymw8iwm/92928217

yolo v12:https://download.csdn.net/download/pbymw8iwm/92928215

yolo v11:https://download.csdn.net/download/pbymw8iwm/92928213

yolo v9:https://download.csdn.net/download/pbymw8iwm/92928210

yolo v8:https://download.csdn.net/download/pbymw8iwm/92928214

yolo v7:https://download.csdn.net/download/pbymw8iwm/92928211

coco json:https://download.csdn.net/download/pbymw8iwm/92928216

pascal voc xml:https://download.csdn.net/download/pbymw8iwm/92928212

YOLO模型训练

下载数据集之后解压到当前文件夹,然后将 我的仓库 https://gitcode.com/pbymw8iwm/YOLOProject 里的训练模型脚本复制到文件夹下,假设你使用的是yolov8来训练你就用python train_yolov8.py
​​

模糊图片在模型训练中的优势分析

该数据集中包含了如果包含了一些模糊图片,这并非数据缺陷,而是一种精心设计的数据增强策略,能为模型训练带来以下显著优势:

  1. 提升模型鲁棒性:现实场景中,可能发生在运动模糊,对焦不准或光线不足的情况下。在训练集中引入模糊样本,可以迫使模型学习更本质的特征,而不是过度依赖清晰的边缘或纹理细节,从而提升模型在复杂、非理想成像条件下的识别能力。
  2. 模拟真实世界噪声:监控摄像头、手机等设备在低光照或快速移动时极易产生模糊。包含此类图片的数据集能让模型提前“见识”并适应这种噪声,减少在实际部署时因图像质量下降而导致的性能骤降。
  3. 防止模型过拟合:如果训练集全是高清、摆拍的完美图片,模型容易记住这些特定场景下的“干净”特征,而对新的、稍有模糊的图片泛化能力差。模糊图片作为一种有效的正则化手段,可以增加数据分布的多样性,防止模型过拟合到有限的清晰样本上。
    总结:因此,数据集中包含的模糊图片,与你看到的“水平翻转”、“剪切形变”、“随机遮挡”等增强操作一样,都是为了构建一个更接近真实世界复杂分布的数据环境,从而训练出更健壮、更泛化、更实用的模型。

模型验证测试情况:

验证测试代码:

#需要安装pip install ultralyticsfromultralyticsimportYOLOimportcv2# ===================== 1. 加载YOLO模型 =====================# 自动下载预训练模型(yolov8n最轻量快速),也可换 yolov8s/m/l/xmodel=YOLO("best.pt")# ===================== 2. 推理配置 =====================image_path="326_jpg.rf.8ad64cc0668df32c4e5f59b50e899e9c.jpg"# 你的图片路径save_result=True# 是否保存标注后的图# ===================== 3. 执行推理 =====================results=model.predict(source=image_path,conf=0.01,# 置信度阈值(低于该值忽略)save=False,# 关闭默认保存,自定义保存verbose=False# 关闭冗余日志)# ===================== 4. 解析结果:目标区域 + 标注信息 =====================print("="*50)print("YOLO 推理结果(目标区域 + 标注信息)")print("="*50)# 获取图片(用于绘制框)img=cv2.imread(image_path)# 遍历所有检测目标foridx,resultinenumerate(results):boxes=result.boxes# 所有检测框forboxinboxes:# ========== 提取目标区域(坐标) ==========# xyxy: 左上角x, 左上角y, 右下角x, 右下角yx1,y1,x2,y2=box.xyxy[0].cpu().numpy()# 宽高w=x2-x1 h=y2-y1# ========== 提取标注信息 ==========cls_id=int(box.cls[0])# 类别IDcls_name=model.names[cls_id]# 类别名称conf=float(box.conf[0])# 置信度# ========== 打印信息 ==========print(f"目标{idx+1}:")print(f" 标注类别:{cls_name}")print(f" 置信度:{conf:.2f}")print(f" 目标区域坐标:")print(f" 左上角 ({x1:.1f},{y1:.1f})")print(f" 右下角 ({x2:.1f},{y2:.1f})")print(f" 宽×高:{w:.1f}×{h:.1f}")print("-"*30)# ========== 在图片上绘制检测框 ==========cv2.rectangle(img,(int(x1),int(y1)),(int(x2),int(y2)),(0,255,0),2)cv2.putText(img,f"{cls_name}{conf:.2f}",(int(x1),int(y1)-10),cv2.FONT_HERSHEY_SIMPLEX,0.5,(0,255,0),2)# ===================== 5. 保存/显示结果 =====================ifsave_result:cv2.imwrite("yolo_result.jpg",img)print("✅ 标注图片已保存为:yolo_result.jpg")# 显示图片(可选)cv2.imshow("YOLO Result",img)#cv2.waitKey(0)#cv2.destroyAllWindows()


推理结果:

{
“predictions”: [
{
“x”: 149,
“y”: 149.5,
“width”: 298,
“height”: 299,
“confidence”: 0.973,
“class”: “Melon Fly”,
“class_id”: 9,
“detection_id”: “1ffd4c71-3bd8-4500-9fd0-a90bcc37eed8”
}
]
}

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/2 19:25:04

[特殊字符] 开源友的聊|OpenClaw爆火之下的冷思考,明天见!

大模型与开源的交汇,正在以前所未有的速度重构一切。 这一次,我们将目光锁定在近期火爆全网的 OpenClaw。它的爆发式增长究竟是昙花一现的流量狂欢,还是技术演进的必然趋势?作为开发者、创业者或企业主,我们该如何在这…

作者头像 李华
网站建设 2026/6/2 19:22:10

洛雪音乐音源完全指南:5分钟打造你的专属高品质音乐库

洛雪音乐音源完全指南:5分钟打造你的专属高品质音乐库 【免费下载链接】lxmusic- lxmusic(洛雪音乐)全网最新最全音源 项目地址: https://gitcode.com/gh_mirrors/lx/lxmusic- 想要免费享受全网无损音乐吗?洛雪音乐音源项目为你提供了完美的解决方…

作者头像 李华
网站建设 2026/6/2 19:22:05

DamaiHelper:基于Selenium的票务自动化解决方案实现原理与应用指南

DamaiHelper:基于Selenium的票务自动化解决方案实现原理与应用指南 【免费下载链接】DamaiHelper 大麦网演唱会演出抢票脚本。 项目地址: https://gitcode.com/gh_mirrors/dama/DamaiHelper 在票务市场供需失衡的背景下,热门演出活动门票往往在开…

作者头像 李华
网站建设 2026/6/2 19:22:00

关于ffmpeg学习的思考,封装与错误处理

历时一个月,我的基于ffmpeg的简单播放器也算是正式完工了,所以写一篇博客这个来记录一下 关于RAII 完整代码见https://github.com/teng-super/mini-player/blob/main/include/ffmpeg_raii.h 首先是关于封装,raii是c的重要思想之一&#xff0c…

作者头像 李华