news 2026/6/15 23:20:30

感知机的对偶形式是怎么来的

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
感知机的对偶形式是怎么来的

感知机的对偶形式是怎么来的:


1. 原始形式:老师亲自调整教案

想象你在教一个学生分类水果:

  • 原始形式:你(老师)心中有一个“标准答案”(权重向量www
  • 看到学生把苹果误判为橘子:你直接修改你的“标准答案”
  • 每次错误都直接调整你的知识体系

特点:知识都储存在你(老师)的脑子里


2. 对偶形式:老师记下所有错题

现在换一种教学方法:

  • 你准备一个错题本,记录每个学生犯的错
  • 学生A把红苹果当橘子:在错题本上给“红苹果”记一笔
  • 学生B把青苹果当橘子:在错题本上给“青苹果”记一笔
  • 最终考试时:遇到新水果,就拿出来跟错题本上的所有记录比较

数学表达
w=∑(错题次数)×(错题样本) w = \sum (\text{错题次数}) \times (\text{错题样本})w=(错题次数)×(错题样本)
判断新样本=比较新样本与所有错题的相似度 \text{判断新样本} = \text{比较新样本与所有错题的相似度}判断新样本=比较新样本与所有错题的相似度


3. 具体数学推导

原始更新规则:

w←w+αyixi(当 yi(w⋅xi)≤0) w \leftarrow w + \alpha y_i x_i \quad (\text{当 } y_i(w \cdot x_i) \leq 0)ww+αyixi(yi(wxi)0)

假设从w0=0w_0 = 0w0=0开始:

  • 第一次更新:w1=αy1x1w_1 = \alpha y_1 x_1w1=αy1x1
  • 第二次更新:w2=w1+αy2x2=αy1x1+αy2x2w_2 = w_1 + \alpha y_2 x_2 = \alpha y_1 x_1 + \alpha y_2 x_2w2=w1+αy2x2=αy1x1+αy2x2
  • 第T次更新后:w=α∑i=1Tyixiw = \alpha \sum_{i=1}^T y_i x_iw=αi=1Tyixi

αi\alpha_iαi= 第i个样本被误分类的次数 × α
w=∑i=1Nαiyixi w = \sum_{i=1}^N \alpha_i y_i x_iw=i=1Nαiyixi


4. 为什么说这像“加权K近邻”?

决策函数变成:
f(x)=sign(w⋅x)=sign(∑i=1Nαiyi(xi⋅x)) f(x) = \text{sign}(w \cdot x) = \text{sign}\left( \sum_{i=1}^N \alpha_i y_i (x_i \cdot x) \right)f(x)=sign(wx)=sign(i=1Nαiyi(xix))

解读

  • xi⋅xx_i \cdot xxix:新样本xxx与训练样本xix_ixi的相似度,点积就是相似度
  • αiyi\alpha_i y_iαiyi:样本xix_ixi的“投票权重”
  • 决策= 所有训练样本的加权投票

5. 对偶形式的巨大价值

(1)核函数技巧的基石

原始形式:w⋅xw \cdot xwx
对偶形式:∑αiyi(xi⋅x)\sum \alpha_i y_i (x_i \cdot x)αiyi(xix)

关键洞察:把内积xi⋅xx_i \cdot xxix替换成核函数K(xi,x)K(x_i, x)K(xi,x),就能处理非线性问题!

(2)支持向量的自然浮现

  • αi>0\alpha_i > 0αi>0的样本就是支持向量
  • αi=0\alpha_i = 0αi=0的样本对最终模型没有贡献
  • 自动实现了“只记住重要样本”

(3)更直观的解释性

每个预测都可以追溯到具体的训练样本:“我判断这个是苹果,因为它很像之前那几个被多次误分类的苹果”


6. 对偶形式 vs 原始形式的对比

特性原始形式 (Primal)对偶形式 (Dual)
参数存储存储权重向量 w存储对偶系数 alpha
决策函数sign(w·x + b)sign(sum(alpha_i*y_i*(x_i·x)) + b)
更新规则w += lr * y_i * x_ialpha_i += lr
支持向量隐式显式 (alpha_i > 0的样本)
核技巧困难容易 (替换内积为核函数)

对偶形式打开了核方法的大门,让线性分类器能够处理极其复杂的非线性问题——这才是它真正的价值所在。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 13:18:52

AI原生应用的架构设计原则

一、AI原生应用的定义与架构演进 1.1 核心定义 AI原生应用是指从设计之初就以人工智能模型(尤其是大语言模型、多模态模型)为核心驱动力,将智能能力内化为系统底层属性,实现数据与模型深度绑定、智能行为自主演进的应用形态。其核…

作者头像 李华
网站建设 2026/6/15 14:07:03

HR人力资源培训体系流程图绘制技巧

良功绘图网站 (https://www.lghuitu.com ) 在企业人力资源管理体系中,培训体系是提升员工能力、支撑组织发展的核心模块,而流程图作为可视化工具,能够将复杂的培训流程拆解为清晰、可执行的步骤,明确各环节责任主体、逻辑关系和时…

作者头像 李华
网站建设 2026/6/15 14:46:21

springboot-java健康体检健身饮食搭配管理系统

目录健康体检健身饮食搭配管理系统摘要开发技术源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!健康体检健身饮食搭配管理系统摘要 随着健康意识的提升,现代人对体检数据管理、健身计划制定及科学饮食搭配的需求日益增长。基…

作者头像 李华
网站建设 2026/6/15 14:42:23

导师严选2026 AI论文网站TOP9:继续教育必用测评

导师严选2026 AI论文网站TOP9:继续教育必用测评 2026年AI论文写作工具测评:为继续教育者提供精准参考 在当前学术研究日益数字化的背景下,AI论文写作工具已成为提升效率、优化内容质量的重要辅助。尤其对于继续教育群体而言,如何在…

作者头像 李华