022、过拟合与欠拟合：正则化、Dropout与早停-编程实验室

022 过拟合与欠拟合：正则化、Dropout与早停

上周调试一个手势识别模型，在STM32上跑，训练集准确率98%，验证集直接掉到62%。我盯着终端输出看了十分钟，脑子里只有一个念头：这模型把训练集的噪声全背下来了。如果你也遇到过类似情况——模型在训练数据上表现完美，一到新数据就翻车——那恭喜你，你撞上了嵌入式机器学习最经典的坑：过拟合。

从一次失败的部署说起

事情是这样的。我用TinyML做了一套基于加速度计的空中写字识别，采集了500组数据，每组包含200个采样点。模型结构很简单：两层Conv1D加两层全连接，总共不到30K参数。训练时loss曲线漂亮得像教科书插图，验证集准确率也稳定在85%以上。我信心满满地烧录到Cortex-M4上，结果实际测试时，写同一个字母“A”，十次里有四次识别成“O”。

问题出在哪？我回看训练数据，发现采集时有个习惯：每次写“A”都从左上角起笔，写“O”都从正上方起笔。模型学到的不是字母的形状特征，而是起笔位置的统计规律。这就是典型的过拟合——模型记住了训练数据中的偶然模式，而不是真正的泛化特征。

欠拟合：另一个极端

过拟合的反面是欠拟合。模型太简单，连训练数据的基本规律都学不到。比如你用线性模型去拟合正弦波，无论怎么调参，loss都降不下去。在嵌入式场景下，欠拟合往往是因为模型容量不够——参数太少，层数太浅，或者特征提取能力不足。

我见过有人为了追求极致的模型体积，把卷积核从3x3改成1x1，结果准确率从92%掉到70%。这不是优化，是自废武功。模型容量和部署资源之间需要平衡，但平衡的前提是模型先

整理会议录音总是慢还理不清？识别语音转文字对比评测供参考

刚入职场的前半个月，我每天下班都要多留一个小时在工位。一周三次入职培训、两次产品分享会，不敢漏过任何一个知识点，只能全程开录音，想着回去慢慢整理。结果一打开录音就发现工作量不小，1小时的录音，逐句听…

李华

量子计算在基因组编码中的应用：MPS技术解析

1. 量子基因组编码：当MPS遇见生物信息学量子计算正在生物信息学领域掀起一场静默的革命。作为一名长期跟踪量子算法落地的研究者，我见证了从理论构想到实际应用的艰难跨越。其中最关键的一环，就是将经典基因组数据高效编码为量子态——这就像…

李华

别再死磕理论了！用Python+LightMAPPO代码实战，5步搞定你的第一个多智能体协作项目

用PythonLightMAPPO实战多智能体协作：5步跑通你的第一个项目当你在论文里读懂了MAPPO的理论框架，打开GitHub准备大干一场时，却发现连第一个训练脚本都跑不起来——这可能是大多数多智能体强化学习（MARL）初学者共同的噩…

李华

MCBXC88x评估板USB驱动更新与安装指南

1. 问题背景与现象描述最近在调试MCBXC88x系列评估板时，遇到了一个典型问题：新到手的MCBXC888/MCBXC886开发板连接电脑后，系统无法自动安装USB转串口驱动。设备管理器中显示为未知设备，手动指定传统驱动包安装也失败。这种情况在嵌…

李华

别再死记硬背了！用Linux Shell特性理解CTF命令执行绕过的本质

从Shell解释器视角解构CTF命令执行绕过的底层逻辑在CTF竞赛中，命令执行漏洞的绕过手法常被简化为"Payload字典"式的记忆，但真正的高手往往能透过现象看本质。当我们深入Linux Shell解释器的工作机制，那些看似魔术般的绕过技巧 sudd…

李华

如何快速部署VideoCrafter：5步完整安装配置指南

如何快速部署VideoCrafter：5步完整安装配置指南【免费下载链接】VideoCrafter VideoCrafter2: Overcoming Data Limitations for High-Quality Video Diffusion Models 项目地址: https://gitcode.com/gh_mirrors/vi/VideoCrafter VideoCrafter是一款强大的…

李华