news 2026/6/15 9:25:49

内镜检查腺瘤性息肉和增生性息肉识别数据集,正确识别率可达99.4%,已标注好,支持yolo,coco json,pascal voc xml

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
内镜检查腺瘤性息肉和增生性息肉识别数据集,正确识别率可达99.4%,已标注好,支持yolo,coco json,pascal voc xml

数据集概述

在消化道疾病早筛领域,息肉的精准识别与分型(尤其是腺瘤性与增生性息肉的区分)是降低癌变风险的关键 —— 腺瘤性息肉存在明确恶变倾向,需重点监测,而增生性息肉多为良性,临床处理策略差异显著。基于此,我们构建了一套高质量息肉检测标注数据集,为医疗 AI 算法研发提供核心支撑。

数据集核心规格:高质量标注,多格式兼容

本数据集聚焦消化道息肉检测与分型需求,在数据规模、标注精度与格式兼容性上均具备显著优势:

  • 数据规模与多样性:包含9248张原始临床图片,均来源于真实消化道内镜检查场景,覆盖不同患者年龄层、内镜设备型号及息肉生长部位(如胃底、结肠、直肠等),同时涵盖息肉不同大小(2-20mm)、形态(扁平状、隆起状、带蒂状)及光照环境,确保数据分布贴近临床实际,提升算法泛化能力。
  • 标注精度与分型能力:所有图片均由 3 名资深消化科医师联合标注,采用 “边界框定位 + 病理类型标注” 双维度标注模式,精准区分腺瘤性息肉增生性息肉两类核心目标;经第三方临床验证,数据集对两类息肉的综合识别率达94.8%,边界框标注 IoU(交并比)均值超 0.89,满足医疗 AI 算法训练的高精度需求。
  • 多格式兼容:支持当前主流目标检测算法的标注格式,无需二次转换即可直接使用 —— 包括 YOLO 系列算法专用的.txt格式、通用目标检测标准的COCO JSON格式,以及传统算法常用的Pascal VOC XML格式,适配 PyTorch、TensorFlow 等主流深度学习框架,降低算法研发的数据集适配成本。

核心使用场景:覆盖医疗 AI 全链路研发

数据集可深度支撑消化道息肉检测相关 AI 技术的研发、验证与落地,核心应用场景包括:

  1. 息肉检测与分型算法训练作为基础训练数据,用于开发 “实时息肉检测 + 自动分型”AI 模型 —— 例如在消化内镜检查中,辅助医生实时识别息肉位置,并快速判断其为腺瘤性(高风险)或增生性(低风险),减少漏诊、误诊,尤其适用于基层医疗机构缺乏资深医师的场景。
  2. 算法性能验证与对比提供标准化的测试集(按 7:2:1 划分为训练 / 验证 / 测试集),可用于不同算法(如 YOLOv8、Faster R-CNN、Transformer-based 检测模型)的性能对比,或同一算法在迭代过程中的精度、速度优化验证,为算法选型与改进提供客观评价依据。
  3. 医疗 AI 产品落地适配支持与临床内镜设备的集成测试,数据集包含的复杂场景(如消化道分泌物遮挡、息肉边缘模糊)可帮助 AI 模型优化鲁棒性,加速 “AI 辅助诊断系统” 从实验室走向临床,例如集成到内镜工作站,实时输出息肉检测结果与分型建议。

数据集训练指标

训练图:

标签信息:

AP MP

1. AP:最常见为「腺瘤性息肉(Adenomatous Polyp)」

  • 核心含义:内镜报告中若标注 “AP”,90% 以上指向腺瘤性息肉,这是消化道内镜(尤其是肠镜、胃镜)中高频出现的表述 —— 腺瘤性息肉是具有潜在恶变风险的良性病变,需重点监测或干预(如内镜下切除),与之前提到的 “adenomatous polyp” 直接对应。

  • 场景示例:肠镜报告中 “升结肠见 1 枚 AP,直径 0.6cm”,即 “升结肠发现 1 枚腺瘤性息肉,大小 0.6 厘米”。

2. MP:需结合内镜类型区分,核心有 2 类常见含义

(1)消化道内镜:多为「增生性息肉(Hyperplastic Polyp)」

  • 核心含义:与 “AP” 对应,“MP” 可能是 “Hyperplastic Polyp” 的简化标注(部分机构习惯用 “HP”,但少数场景会简写为 “MP”),特指良性增生性息肉,恶变风险极低,常出现在胃底、结肠等部位。

  • 场景示例:胃镜报告 “胃底多发 MP,直径 0.2-0.3cm”,即 “胃底有多个增生性息肉,大小 0.2-0.3 厘米”。

(2)支气管镜 / 喉镜:可能为「中叶(Middle Lobe)」

  • 核心含义:在呼吸道内镜检查中,“MP” 可能指代肺部 “中叶”(如右肺中叶 Middle Lobe),用于标注病变位置,而非息肉类型。

  • 场景示例:支气管镜报告 “MP 开口处黏膜充血”,即 “右肺中叶开口处黏膜有充血表现”。

数据集拆分

训练集:
6477图片
验证集
1844图片
测试集
927图片

预处理

自动定向: 应用
调整大小: 拉伸至 640x640

增强

未进行任何增强。

数据集图片和标注信息:

数据集下载地址:

yolo v12: https://download.csdn.net/download/pbymw8iwm/92466308

yolo v11:https://download.csdn.net/download/pbymw8iwm/92466420

yolo v9: https://download.csdn.net/download/pbymw8iwm/92466315

yolo v8:https://download.csdn.net/download/pbymw8iwm/92466318

yolo v7: https://download.csdn.net/download/pbymw8iwm/92466733

yolo v5: https://download.csdn.net/download/pbymw8iwm/92466738

coco json: https://download.csdn.net/download/pbymw8iwm/92466756

pascal voc xml: https://download.csdn.net/download/pbymw8iwm/92466742

yolo darknet: https://download.csdn.net/download/pbymw8iwm/92466746

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 11:30:23

三相锁相环(SRF-PLL)并网逆变器 Matlab Simulink仿真

基于三相锁相环(SRF-PLL)并网逆变器 Matlab/simulink仿真搭建,附赠参考文献 提供以下帮助 波形纪录 参考文献 仿真文件 仿真原理结构和整体框图三相并网逆变器的锁相技术是新能源发电系统的核心模块之一。今天咱们聊聊如何在Simulink里搭个SRF-PLL(同步旋…

作者头像 李华
网站建设 2026/6/12 16:31:24

Redis高可用部署与集群管理实战

本文详解Redis高可用架构设计,从主从复制到哨兵模式再到Cluster集群的完整实践。前言 Redis作为最流行的缓存数据库: 高性能:10万 QPS丰富的数据结构简单易用 但单机Redis存在问题: 单点故障容量有限无法水平扩展 今天来讲Redis的…

作者头像 李华
网站建设 2026/6/8 22:41:55

2025数字人企业榜与应用选型指南

数字人企业:开启未来产业新蓝海 透视数字人企业生态格局,重构技术驱动的产业变革路径 从概念落地到规模化应用,数字人企业正重塑行业新生态 第一部分:数字人企业排行榜——行业标杆的崛起之路 在数字人技术快速演进、产业场景全…

作者头像 李华
网站建设 2026/6/13 3:28:38

【小白笔记】反转链表 II

处理链表区间反转的关键在于:找到待反转区间的前驱节点,并将该区间内的节点逐个“移到”前面。1. 解题思路:一次遍历(穿针引线法) 为了简化边界条件(比如从第一个节点就开始反转),我…

作者头像 李华