news 2026/6/1 18:23:43

输电杆塔绝缘子红外测温图像检测数据集VOC+YOLO格式420张1类别

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
输电杆塔绝缘子红外测温图像检测数据集VOC+YOLO格式420张1类别

数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)

图片数量(jpg文件个数):420

标注数量(xml文件个数):420

标注数量(txt文件个数):420

标注类别数:1

所在github仓库:firc-dataset

标注类别名称:["insulator"]

每个类别标注的框数:

insulator 框数 = 813

总框数:813

图片分辨率:416x416

使用标注工具:labelImg

标注规则:对类别进行画矩形框

重要说明:暂无

特别声明:本数据集不对训练的模型或者权重文件精度作任何保证

图片预览:

标注例子:

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/4 20:11:11

HuggingFace镜像网站对比:哪家更适合拉取VoxCPM-1.5-TTS-WEB-UI?

HuggingFace镜像网站对比:哪家更适合拉取VoxCPM-1.5-TTS-WEB-UI? 在AI语音合成技术快速普及的今天,一个看似不起眼的部署细节——模型下载速度,往往决定了项目是“半小时上线”还是“卡在第一步”。尤其是面对像 VoxCPM-1.5-TTS-…

作者头像 李华
网站建设 2026/5/28 8:07:29

知识库建设:沉淀常见Sonic使用问题的答案

Sonic 数字人视频生成技术解析:从原理到高效实践 在短视频内容爆炸式增长的今天,如何快速、低成本地生产高质量数字人讲解视频,已成为教育、电商、政务等多个行业面临的共同挑战。传统方案依赖专业团队与昂贵设备,流程复杂且周期长…

作者头像 李华
网站建设 2026/5/11 12:50:51

东南亚小语种支持情况?依赖TTS质量

Sonic数字人与东南亚小语种TTS协同应用深度解析 在跨境电商、在线教育和短视频出海的浪潮中,内容本地化正从“可选项”变为“必选项”。尤其面对语言多样、文化差异显著的东南亚市场——泰语的六声调系统、越南语的复杂音变规则、印尼语的区域性口音差异——如何高…

作者头像 李华
网站建设 2026/5/27 7:27:48

2024技术趋势:AI领衔,安全升级

引言部分技术趋势预测的背景与意义CSDN作为技术社区的数据来源价值2023年技术领域的关键事件回顾人工智能与机器学习大模型多模态应用的深化(如GPT-5、Gemini演进)边缘AI与轻量化模型的落地场景AI伦理与法规的行业影响云计算与原生技术混合云与多云架构的…

作者头像 李华
网站建设 2026/5/21 21:40:40

动作自然流畅:motion_scale保持1.0-1.1防止夸张变形

动作自然流畅:motion_scale保持1.0-1.1防止夸张变形 在虚拟主播24小时不间断带货、AI教师批量生成教学视频的今天,数字人早已不再是影视特效工作室的专属产物。随着Sonic这类轻量级口型同步模型的出现,仅凭一张照片和一段音频就能生成逼真说话…

作者头像 李华
网站建设 2026/5/19 14:45:47

调用频率控制:限制单个账号每秒请求Sonic次数

调用频率控制:限制单个账号每秒请求Sonic次数 在数字人内容爆发式增长的今天,只需一张照片和一段音频就能生成逼真“虚拟主播”的技术已不再是科幻。腾讯联合浙江大学推出的轻量级口型同步模型 Sonic,正悄然改变着短视频创作、在线教育乃至电…

作者头像 李华