news 2026/6/15 21:53:35

Huber损失函数:前面像平方误差(更平滑)、后面像绝对误差(不怕离群点)”的误差函数。它用来衡量预测值和真实值的差距,比纯平方误差更不容易被极端错误样本“带偏”

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Huber损失函数:前面像平方误差(更平滑)、后面像绝对误差(不怕离群点)”的误差函数。它用来衡量预测值和真实值的差距,比纯平方误差更不容易被极端错误样本“带偏”

Huber 损失是一种“前面像平方误差(更平滑)、后面像绝对误差(不怕离群点)”的误差函数。它用来衡量预测值和真实值的差距,比纯平方误差更不容易被极端错误样本“带偏”。


1) 先定义“误差”

设真实值是y yy,预测值是y ^ \hat yy^,那么误差(残差)是

e = y ^ − y e = \hat y - ye=y^y

我们关心的是误差的大小∣ e ∣ |e|e


2) Huber 损失公式

Huber 损失有一个阈值参数δ > 0 \delta>0δ>0(读作 delta),表示“误差多大算大”。

L δ ( e ) = { 1 2 e 2 , ∣ e ∣ ≤ δ δ ( ∣ e ∣ − 1 2 δ ) , ∣ e ∣ > δ L_\delta(e)= \begin{cases} \frac{1}{2}e^2, & |e|\le \delta \\ \delta\left(|e|-\frac{1}{2}\delta\right), & |e|>\delta \end{cases}Lδ(e)={21e2,δ(e21δ),eδe>δ


3) 高中生直觉理解

把它想成“两段式惩罚”:

当误差不大(∣ e ∣ ≤ δ |e|\le\deltaeδ

用平方惩罚:

L = 1 2 e 2 L=\frac{1}{2}e^2L=21e2

  • 小误差时,平方误差能给出更细腻的惩罚(误差从 1 变 2,损失从 0.5 变 2,增加很多),促使模型把小误差继续磨小。
  • 曲线是圆滑的抛物线,训练更稳定。

当误差很大(∣ e ∣ > δ |e|>\deltae>δ

改用“近似绝对值”的线性惩罚:

L = δ ( ∣ e ∣ − 1 2 δ ) L=\delta\left(|e|-\frac{1}{2}\delta\right)L=δ(e21δ)

  • 这时损失随误差大小线性增长,不像平方那样爆炸。
  • 所以遇到“离群点/标注错误/极端样本”,不会把模型拉得太狠。

4) 为什么要这样“拼接”?

对比两种常见损失:

  • 平方误差(MSE)1 2 e 2 \frac{1}{2}e^221e2
    大误差会被放大得非常厉害(例如误差 10,损失 50),容易被少数离群点主导。

  • 绝对误差(MAE)∣ e ∣ |e|e
    不怕离群点,但在误差接近 0 的地方“尖”,优化时不如平方那样平滑。

Huber就是把两者优点合在一起:

  • 小误差:用平方(平滑、好优化)
  • 大误差:用线性(抗离群点)

5) 一个简单数值例子(取δ = 1 \delta=1δ=1

假设误差e = 0.5 e=0.5e=0.5(小误差):

L = 1 2 × 0.5 2 = 0.125 L=\frac{1}{2}\times 0.5^2=0.125L=21×0.52=0.125

假设误差e = 3 e=3e=3(大误差):

L = 1 × ( 3 − 1 2 × 1 ) = 2.5 L=1\times\left(3-\frac{1}{2}\times1\right)=2.5L=1×(321×1)=2.5

如果用平方误差,1 2 × 3 2 = 4.5 \frac{1}{2}\times 3^2=4.521×32=4.5,会惩罚更猛;Huber 就“温和”很多。


如果你告诉我你的任务里误差是“距离(米)”还是“像素/栅格”,我也可以顺便解释δ \deltaδ一般怎么选(比如和栅格分辨率、噪声尺度对应)。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 12:45:13

平衡小车分层PID控制架构与工程实现

1. 平衡小车控制系统的工程拆解与架构设计 平衡小车是一个典型的多变量、强耦合、非线性控制系统。其核心挑战在于:在动态运动过程中,必须同步实现姿态稳定(直立)、速度跟踪(行走)与方向调控(转向)三大目标。这三者并非独立存在,而是通过同一组执行机构——左右轮电机…

作者头像 李华
网站建设 2026/6/15 12:44:01

MPU6050 DMP FIFO溢出防护与双任务采集架构设计

1. MPU6050 DMP数据采集任务设计与FIFO溢出防护机制 在基于STM32的智能平衡小车系统中,MPU6050作为核心姿态传感器,其DMP(Digital Motion Processor)引擎承担着实时解算欧拉角、四元数等关键运动学参数的任务。然而,大量开发者在初期调试阶段会遭遇一个典型现象:串口打印…

作者头像 李华
网站建设 2026/6/15 12:47:14

STM32软件模拟I²C驱动MPU-6050六轴传感器

1. MPU-6050在平衡小车系统中的工程定位与数据流设计 在STM32F407平台构建的智能平衡小车系统中,MPU-6050并非一个孤立的传感器模块,而是整个姿态解算闭环的核心数据源。其输出的原始加速度计(Accelerometer)和陀螺仪(Gyroscope)数据,构成了后续所有姿态估计算法的输入…

作者头像 李华
网站建设 2026/6/15 12:44:06

WuliArt Qwen-Image Turbo一文详解:从Prompt输入到JPEG高清输出全流程

WuliArt Qwen-Image Turbo一文详解:从Prompt输入到JPEG高清输出全流程 1. 为什么这款文生图工具值得你花5分钟了解 你有没有试过在本地跑一个文生图模型,结果等了两分钟,出来一张黑图?或者刚点下生成,显存就爆了&…

作者头像 李华
网站建设 2026/6/15 12:45:01

Qwen3-ASR在医疗领域的应用:语音电子病历系统开发

Qwen3-ASR在医疗领域的应用:语音电子病历系统开发 医生查房时,一边观察病人情况,一边口述记录,旁边还得有个人手忙脚乱地打字——这个场景在很多医院里每天都在上演。查完房回到办公室,医生还得花大量时间整理、核对、…

作者头像 李华
网站建设 2026/6/15 13:39:31

DeepSeek-OCR实测体验:一键解析复杂表格和手稿的惊艳效果

DeepSeek-OCR实测体验:一键解析复杂表格和手稿的惊艳效果 1. 这不是传统OCR,是文档理解的跃迁 你有没有过这样的时刻: 面对一张扫描的财务报表,密密麻麻的合并单元格、跨页表格、手写批注混在一起,Excel里复制粘贴全…

作者头像 李华