带标注的番茄西红柿病害和虫害检测数据集，可识别健康叶，8种虫害和9种病害，识别率86.6%，6639张图，支持yolo，coco json，voc xml,文末有模型训练代码-编程实验室

带标注的番茄西红柿病害和虫害检测数据集，可识别健康叶，8种虫害和9种病害，识别率86.6%，6639张图，支持yolo，coco json，voc xml,文末有模型训练代码

模型训练指标参数：

模型训练图：

数据集拆分

总图数：6639 张图数
训练集

5794 张图

验证集

544 张图

测试集

301 张图

预处理

自动定向：应用

调整大小：拉伸到266x266

增强

单样本输出数：3
90° 旋转：顺时针、逆时针、上下翻转
旋转角度：±15°
曝光调整：±5%

数据集标签：

[‘Bacterial Spot’, ‘Cotton Bollworm’, ‘Melon Thrips’, ‘Early Blight’, ‘Red Spider Mite’, ‘Leaf Mold’, ‘Green Peach Aphid’, ‘Two-spotted Spider Mite’, ‘Late Blight’, ‘Melon Fly’, ‘Target Spot’, ‘Septoria Leaf Spot’, ‘Greenhouse Whitefly’, ‘Mosaic Virus’, ‘Yellow Leaf Curl Virus’, ‘Tobacco Caterpillar’, ‘Healthy’, ‘Beet Armyworm’]

标签解释：

英文名称	中文译名
Healthy	健康植株
Bacterial Spot	细菌性斑点病
Beet Armyworm	甜菜夜蛾
Cotton Bollworm	棉铃虫
Early Blight	早疫病
Green Peach Aphid	桃蚜（桃绿蚜）
Greenhouse Whitefly	温室白粉虱
Late Blight	晚疫病
Leaf Mold	叶霉病
Melon Fly	瓜实蝇
Melon Thrips	瓜蓟马
Mosaic Virus	花叶病毒病
Red Spider Mite	红蜘蛛
Septoria Leaf Spot	斑枯病（壳针孢叶斑病）
Target Spot	靶斑病
Tobacco Caterpillar	烟青虫
Two-spotted Spider Mite	二斑叶螨
Yellow Leaf Curl Virus	黄化曲叶病毒病

数据集图片和标注信息示例：

数据集下载：

yolo26:https://download.csdn.net/download/pbymw8iwm/92928217

yolo v12:https://download.csdn.net/download/pbymw8iwm/92928215

yolo v11:https://download.csdn.net/download/pbymw8iwm/92928213

yolo v9:https://download.csdn.net/download/pbymw8iwm/92928210

yolo v8:https://download.csdn.net/download/pbymw8iwm/92928214

yolo v7:https://download.csdn.net/download/pbymw8iwm/92928211

coco json:https://download.csdn.net/download/pbymw8iwm/92928216

pascal voc xml:https://download.csdn.net/download/pbymw8iwm/92928212

YOLO模型训练

下载数据集之后解压到当前文件夹，然后将我的仓库 https://gitcode.com/pbymw8iwm/YOLOProject 里的训练模型脚本复制到文件夹下，假设你使用的是yolov8来训练你就用python train_yolov8.py

模糊图片在模型训练中的优势分析

该数据集中包含了如果包含了一些模糊图片，这并非数据缺陷，而是一种精心设计的数据增强策略，能为模型训练带来以下显著优势：

提升模型鲁棒性：现实场景中，可能发生在运动模糊，对焦不准或光线不足的情况下。在训练集中引入模糊样本，可以迫使模型学习更本质的特征，而不是过度依赖清晰的边缘或纹理细节，从而提升模型在复杂、非理想成像条件下的识别能力。
模拟真实世界噪声：监控摄像头、手机等设备在低光照或快速移动时极易产生模糊。包含此类图片的数据集能让模型提前“见识”并适应这种噪声，减少在实际部署时因图像质量下降而导致的性能骤降。
防止模型过拟合：如果训练集全是高清、摆拍的完美图片，模型容易记住这些特定场景下的“干净”特征，而对新的、稍有模糊的图片泛化能力差。模糊图片作为一种有效的正则化手段，可以增加数据分布的多样性，防止模型过拟合到有限的清晰样本上。
总结：因此，数据集中包含的模糊图片，与你看到的“水平翻转”、“剪切形变”、“随机遮挡”等增强操作一样，都是为了构建一个更接近真实世界复杂分布的数据环境，从而训练出更健壮、更泛化、更实用的模型。

模型验证测试情况：

验证测试代码：

#需要安装pip install ultralyticsfromultralyticsimportYOLOimportcv2# ===================== 1. 加载YOLO模型 =====================# 自动下载预训练模型(yolov8n最轻量快速)，也可换 yolov8s/m/l/xmodel=YOLO("best.pt")# ===================== 2. 推理配置 =====================image_path="326_jpg.rf.8ad64cc0668df32c4e5f59b50e899e9c.jpg"# 你的图片路径save_result=True# 是否保存标注后的图# ===================== 3. 执行推理 =====================results=model.predict(source=image_path,conf=0.01,# 置信度阈值（低于该值忽略）save=False,# 关闭默认保存，自定义保存verbose=False# 关闭冗余日志)# ===================== 4. 解析结果：目标区域 + 标注信息 =====================print("="*50)print("YOLO 推理结果（目标区域 + 标注信息）")print("="*50)# 获取图片（用于绘制框）img=cv2.imread(image_path)# 遍历所有检测目标foridx,resultinenumerate(results):boxes=result.boxes# 所有检测框forboxinboxes:# ========== 提取目标区域（坐标） ==========# xyxy: 左上角x, 左上角y, 右下角x, 右下角yx1,y1,x2,y2=box.xyxy[0].cpu().numpy()# 宽高w=x2-x1 h=y2-y1# ========== 提取标注信息 ==========cls_id=int(box.cls[0])# 类别IDcls_name=model.names[cls_id]# 类别名称conf=float(box.conf[0])# 置信度# ========== 打印信息 ==========print(f"目标{idx+1}:")print(f" 标注类别：{cls_name}")print(f" 置信度：{conf:.2f}")print(f" 目标区域坐标：")print(f" 左上角 ({x1:.1f},{y1:.1f})")print(f" 右下角 ({x2:.1f},{y2:.1f})")print(f" 宽×高：{w:.1f}×{h:.1f}")print("-"*30)# ========== 在图片上绘制检测框 ==========cv2.rectangle(img,(int(x1),int(y1)),(int(x2),int(y2)),(0,255,0),2)cv2.putText(img,f"{cls_name}{conf:.2f}",(int(x1),int(y1)-10),cv2.FONT_HERSHEY_SIMPLEX,0.5,(0,255,0),2)# ===================== 5. 保存/显示结果 =====================ifsave_result:cv2.imwrite("yolo_result.jpg",img)print("✅ 标注图片已保存为：yolo_result.jpg")# 显示图片（可选）cv2.imshow("YOLO Result",img)#cv2.waitKey(0)#cv2.destroyAllWindows()

推理结果：

{
“predictions”: [
{
“x”: 149,
“y”: 149.5,
“width”: 298,
“height”: 299,
“confidence”: 0.973,
“class”: “Melon Fly”,
“class_id”: 9,
“detection_id”: “1ffd4c71-3bd8-4500-9fd0-a90bcc37eed8”
}
]
}