news 2026/6/15 21:07:40

大模型从0到精通:错题本与得分卡 —— AI如何知道自己“错”了?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
大模型从0到精通:错题本与得分卡 —— AI如何知道自己“错”了?

本文是《大模型从0到精通》系列第一卷“奠基篇”的第二章。上章我们找到了预测直线,但怎么知道这条线是“好”是“坏”?本章将引入损失函数——AI的“错题本”与“得分卡”,让你理解AI如何量化自己的错误,为后续的优化学习奠定基础。

一、从“感觉差不多”到“数字评分”

上章我们通过奶茶店案例找到了预测直线 。但有个关键问题没解决:

你怎么知道这条线是“好”是“坏”?是“差不多”还是“差很多”?

凭感觉?看心情?不行!我们需要一个客观、量化的评分标准

从单点误差开始

看下面这个数据点:气温28℃,实际销售额105杯,我们的模型预测是:

这个“9杯”就是单点误差——数据点到预测直线的垂直距离。距离越远,错得越离谱。

二、损失函数:AI的“考试总分”

把所有误差综合成一个数字

一个数据点有误差不够,我们要看整体表现。就像考试:

  • 单题得分 → 单点误差
  • 总分 → 损失函数值

最常见的损失函数是均方误差(MSE)

  1. 计算每个数据点的误差
  2. 把误差平方(让大误差惩罚更重)
  3. 求所有平方误差的平均值

公式:计算预测值与真实值差的平方的平均值 loss = (y_pred - y_true)² / n

为什么用平方?

  1. 消除正负号影响:误差平方后都是正数
  2. 放大严重错误:误差10杯 → 惩罚100,误差20杯 → 惩罚400(4倍!)
  3. 数学性质好:方便求导,利于后续优化

三、最强比喻:错题山谷

把抽象问题可视化

想象一个三维地形

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 14:21:10

Windows系统文件scrptadm.dll丢失损坏 无法运行软件 下载修复

在使用电脑系统时经常会出现丢失找不到某些文件的情况,由于很多常用软件都是采用 Microsoft Visual Studio 编写的,所以这类软件的运行需要依赖微软Visual C运行库,比如像 QQ、迅雷、Adobe 软件等等,如果没有安装VC运行库或者安装…

作者头像 李华
网站建设 2026/6/15 12:41:16

开源鸿蒙跨平台开发训练营--AtomGit(GitCode)口袋工具(七)

我们继续接着上一章的内容,完成文件内容的显示。显示文件内容1. 调整侧边栏内容上一章,我们侧边栏只显示了根目录下的文件和文件夹。这一张我们要将其显示成一个可折叠和展开的文件树。目的是为了可以让用户在侧边栏中切换想要查看的文件。GitCodeCodeRe…

作者头像 李华
网站建设 2026/6/15 12:41:11

【鸿蒙开发案例篇】基于MindSpore Lite的端侧人物图像分割案例

大家好,我是 V 哥。今天的内容咱们来详细介绍鸿蒙开发中,如何使用MindSpore Lite在鸿蒙系统上实现端侧人物图像分割功能,以及提供完整的实现方案。 联系V哥获取 鸿蒙学习资料 系统架构设计 技术栈与组件关系 #mermaid-svg-kKMHq6sLNO6nbkY…

作者头像 李华
网站建设 2026/6/15 19:22:15

程序员应该熟悉的概念(6)Fine-tuning和RAG

大语言模型/LLM 通常是由海量通用知识(如语法、常识、逻辑)训练的,在面对具体场景(如医疗问诊、法律文书生成)时,能力往往不足。 Fine-tuning/微调 正是为解决这一问题而生的核心技术,其本质是在…

作者头像 李华
网站建设 2026/6/15 12:41:47

7、电子元件与树莓派开发入门

电子元件与树莓派开发入门 1. 常见电子元件介绍 二极管(Diodes) :电阻会双向阻止电流流动,而二极管是一种双端电子元件,具有单向低电阻、反向高电阻的特性。二极管大多由硅制成,发光二极管(LED)是电子电路中最常用的二极管,当在其阳极和阴极提供足够电压时会发光。…

作者头像 李华
网站建设 2026/6/15 11:47:20

数据不丢失 + SEO 保障!LTD 营销枢纽破解外贸建站核心痛点

为什么选择LTD营销枢纽?很多企业担心SaaS建站“停止续费就丢站”,但LTD营销枢纽提供“数据备份自由”——你可随时导出网站所有数据(包括客户信息、内容素材、订单记录),即使后续选择其他方案,核心资源也不…

作者头像 李华