news 2026/5/1 8:07:42

17、机器学习中的性能评估与数据集处理

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
17、机器学习中的性能评估与数据集处理

机器学习中的性能评估与数据集处理

1. 人类水平性能概述

人类水平性能(Human - Level Performance,HLP)在机器学习评估中是一个重要概念。在人类擅长的任务,如图像识别中,人类水平性能可作为贝叶斯误差的良好近似。但对于人类不擅长的任务,其性能可能与贝叶斯误差相差甚远。

Andrej Karpathy在2014年的ILSVRC(ImageNet Large Scale Visual Recognition Challenge)中的工作很好地说明了人类水平性能的评估复杂性。该挑战包含120万张图像的训练集,分为1000个类别。GoogleLeNet模型达到了6.7%的误差率,Karpathy想了解人类的表现如何。

最初认为由于图像由人类分类,人类水平误差率(ϵhlp)应为0%,但实际并非如此。图像通过网络搜索获取,然后通过向人们询问二元问题(如“这是一个钩子吗?”)进行过滤和标注,并非像算法那样从1000个类别中为每张图像分配一个类别。

Karpathy开发了一个网络界面,左边是图像,右边是1000个类别及示例。人们使用该界面时不断漏选类别和犯错,最佳误差率约为15%。后来,Karpathy亲自进行仔细标注,达到了惊人的ϵhlp = 5.1%,比当时最好的算法还要好1.7%。他还列出了GoogLeNet比人类更易出错的情况(如图像中有多个对象),以及人类比GoogLeNet更易出错的情况(如类别粒度大,像狗有120个不同子类)。

2. MNIST数据集上的人类水平性能

MNIST数据集上的人类水平性能也有广泛分析,结果显示ϵhlp = 0.2%。人们可能疑惑为何人类不能100%准确分类简单数字,实

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 5:23:26

20、超参数调优:黑盒优化方法解析

超参数调优:黑盒优化方法解析 1. 黑盒优化概述 在机器学习和深度学习中,超参数调优是一个至关重要的问题。超参数调优本质上是黑盒优化问题的一个子类。黑盒函数 (f(x)) 是一种其解析形式未知的函数,我们只能获取其在定义范围内所有 (x) 值对应的函数值,而无法获取其他信…

作者头像 李华
网站建设 2026/5/1 5:25:23

13、安卓实用应用推荐

安卓实用应用推荐 在当今数字化时代,安卓应用为我们的生活带来了极大的便利。无论是获取新闻天气信息,还是进行摄影和视频编辑,都有众多优秀的应用可供选择。下面为大家介绍一些实用的安卓应用。 新闻与天气类应用 WeatherBug Elite :售价1.99美元。很多人出门不带伞被…

作者头像 李华
网站建设 2026/5/1 5:26:59

SpringBoot+Vue web物流管理系统管理平台源码【适合毕设/课设/学习】Java+MySQL

摘要 现代物流行业的快速发展对信息管理系统的智能化、高效化提出了更高要求。传统物流管理依赖人工操作和纸质记录,存在效率低下、错误率高、信息不共享等问题。随着电子商务的兴起,物流需求激增,亟需一套集成化、数字化的管理系统来优化仓…

作者头像 李华
网站建设 2026/4/30 9:04:41

GPT-SoVITS商业应用合规性探讨:版权与伦理问题

GPT-SoVITS商业应用合规性探讨:版权与伦理问题 在虚拟主播直播带货、AI配音一键生成有声书、智能客服模仿真人语调的今天,声音的“复制”变得前所未有的简单。只需一段一分钟的录音,一个高度拟真的语音模型就能被训练出来——这不再是科幻情…

作者头像 李华
网站建设 2026/5/1 6:19:20

企业级语音解决方案:基于GPT-SoVITS的私有化部署

企业级语音解决方案:基于GPT-SoVITS的私有化部署 在智能客服系统频繁“听不懂人话”、虚拟助手声音千篇一律的今天,越来越多企业开始意识到:真正的语音交互体验,不仅在于“能说”,更在于“像谁在说”。尤其是在金融、医…

作者头像 李华
网站建设 2026/5/1 6:20:50

GPT-SoVITS结合ASR构建闭环语音系统:完整架构设计

GPT-SoVITS结合ASR构建闭环语音系统:完整架构设计 在智能语音助手、虚拟主播和远程交互服务日益普及的今天,用户不再满足于“能说话”的机器,而是期待一个“听得懂、答得像、有个性”的数字伙伴。然而,传统语音合成系统往往依赖数…

作者头像 李华