news 2026/5/29 3:20:59

022、过拟合与欠拟合:正则化、Dropout与早停

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
022、过拟合与欠拟合:正则化、Dropout与早停

022 过拟合与欠拟合:正则化、Dropout与早停

上周调试一个手势识别模型,在STM32上跑,训练集准确率98%,验证集直接掉到62%。我盯着终端输出看了十分钟,脑子里只有一个念头:这模型把训练集的噪声全背下来了。如果你也遇到过类似情况——模型在训练数据上表现完美,一到新数据就翻车——那恭喜你,你撞上了嵌入式机器学习最经典的坑:过拟合。

从一次失败的部署说起

事情是这样的。我用TinyML做了一套基于加速度计的空中写字识别,采集了500组数据,每组包含200个采样点。模型结构很简单:两层Conv1D加两层全连接,总共不到30K参数。训练时loss曲线漂亮得像教科书插图,验证集准确率也稳定在85%以上。我信心满满地烧录到Cortex-M4上,结果实际测试时,写同一个字母“A”,十次里有四次识别成“O”。

问题出在哪?我回看训练数据,发现采集时有个习惯:每次写“A”都从左上角起笔,写“O”都从正上方起笔。模型学到的不是字母的形状特征,而是起笔位置的统计规律。这就是典型的过拟合——模型记住了训练数据中的偶然模式,而不是真正的泛化特征。

欠拟合:另一个极端

过拟合的反面是欠拟合。模型太简单,连训练数据的基本规律都学不到。比如你用线性模型去拟合正弦波,无论怎么调参,loss都降不下去。在嵌入式场景下,欠拟合往往是因为模型容量不够——参数太少,层数太浅,或者特征提取能力不足。

我见过有人为了追求极致的模型体积,把卷积核从3x3改成1x1,结果准确率从92%掉到70%。这不是优化,是自废武功。模型容量和部署资源之间需要平衡,但平衡的前提是模型先

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/29 3:11:02

整理会议录音总是慢还理不清?识别语音转文字对比评测供参考

刚入职场的前半个月,我每天下班都要多留一个小时在工位。一周三次入职培训、两次产品分享会,不敢漏过任何一个知识点,只能全程开录音,想着回去慢慢整理。结果一打开录音就发现工作量不小,1小时的录音,逐句听…

作者头像 李华
网站建设 2026/5/29 3:09:01

量子计算在基因组编码中的应用:MPS技术解析

1. 量子基因组编码:当MPS遇见生物信息学量子计算正在生物信息学领域掀起一场静默的革命。作为一名长期跟踪量子算法落地的研究者,我见证了从理论构想到实际应用的艰难跨越。其中最关键的一环,就是将经典基因组数据高效编码为量子态——这就像…

作者头像 李华
网站建设 2026/5/29 3:07:57

MCBXC88x评估板USB驱动更新与安装指南

1. 问题背景与现象描述最近在调试MCBXC88x系列评估板时,遇到了一个典型问题:新到手的MCBXC888/MCBXC886开发板连接电脑后,系统无法自动安装USB转串口驱动。设备管理器中显示为未知设备,手动指定传统驱动包安装也失败。这种情况在嵌…

作者头像 李华
网站建设 2026/5/29 3:07:12

别再死记硬背了!用Linux Shell特性理解CTF命令执行绕过的本质

从Shell解释器视角解构CTF命令执行绕过的底层逻辑在CTF竞赛中,命令执行漏洞的绕过手法常被简化为"Payload字典"式的记忆,但真正的高手往往能透过现象看本质。当我们深入Linux Shell解释器的工作机制,那些看似魔术般的绕过技巧 sudd…

作者头像 李华
网站建设 2026/5/29 3:06:52

如何快速部署VideoCrafter:5步完整安装配置指南

如何快速部署VideoCrafter:5步完整安装配置指南 【免费下载链接】VideoCrafter VideoCrafter2: Overcoming Data Limitations for High-Quality Video Diffusion Models 项目地址: https://gitcode.com/gh_mirrors/vi/VideoCrafter VideoCrafter是一款强大的…

作者头像 李华