news 2026/5/23 7:19:05

机器学习篇---从不同直观角度理解矩阵与矩阵运算

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
机器学习篇---从不同直观角度理解矩阵与矩阵运算

矩阵是线性代数的核心,但很多人只把它看作 "一堆数字排成的矩形",这就像只看到了计算机的外壳,却没看到它能运行程序、处理信息的强大功能。实际上,矩阵是一个多面手,从不同角度看,它有完全不同的直观意义,而矩阵运算也对应着这些意义下的具体操作。

一、最直观:数据表格角度

这是几乎所有人接触矩阵的第一个角度,也是最容易理解的角度。

矩阵是什么?

矩阵就是一张结构化的数据表格,行和列分别代表不同的类别,每个元素是对应类别的数据值。

例子:某班级 3 名学生的 3 门课程成绩

[语文 数学 英语] [85 92 78] 小明 [76 88 95] 小红 [90 75 82] 小刚

这就是一个 3×3 矩阵,行代表学生,列代表课程,元素代表成绩。

矩阵运算的直观意义

  • 矩阵加法:对应位置的数据相加。比如把期中考试成绩矩阵和期末考试成绩矩阵相加,得到总成绩矩阵。
  • 数乘矩阵:所有数据乘以同一个数。比如把所有成绩乘以 0.5(占比 50%)。
  • 矩阵乘法数据的加权求和与转换。比如计算每个学生的总分(权重都是 1)或加权平均分(语文 0.3,数学 0.4,英语 0.3)。

例子:计算加权平均分

[85 92 78] [0.3] [85×0.3+92×0.4+78×0.3] = [85.7] [76 88 95] × [0.4] = [76×0.3+88×0.4+95×0.3] = [87.5] [90 75 82] [0.3] [90×0.3+75×0.4+82×0.3] = [81.6]

结果是一个 3×1 矩阵,每个元素就是对应学生的加权平均分。

二、最核心:线性变换角度

这是矩阵最本质、最强大的角度,也是线性代数在计算机图形学、机器学习、物理学等领域广泛应用的基础。

矩阵是什么?

矩阵是一个线性变换的 "操作符",它能把一个向量(空间中的点)变成另一个向量(空间中的另一个点)。

线性变换的特点

  1. 原点保持不动
  2. 直线变换后还是直线
  3. 平行四边形变换后还是平行四边形

常见的线性变换矩阵(以 2D 平面为例):

  • 旋转矩阵:将向量绕原点旋转 θ 角
    [cosθ -sinθ] [sinθ cosθ]
  • 缩放矩阵:将向量在 x 轴缩放 a 倍,y 轴缩放 b 倍
    [a 0] [0 b]
  • 剪切矩阵:将向量沿 x 轴剪切 k 倍
    [1 k] [0 1]

矩阵运算的直观意义

  • 矩阵乘法变换的复合。先做矩阵 A 代表的变换,再做矩阵 B 代表的变换,总的效果就是矩阵 B×A 代表的变换(注意顺序!)。
  • 单位矩阵恒等变换,什么都不做。
  • 逆矩阵逆变换,把矩阵 A 做的变换 "还原" 回去。如果 A 是旋转 90 度,那么 A⁻¹ 就是旋转 - 90 度。
  • 行列式变换的面积 / 体积缩放因子。如果行列式是 2,说明变换后图形的面积变成原来的 2 倍;如果行列式是负数,说明变换包含了 "翻转"(镜像)。

生动类比:矩阵就像一个 "变形器",向量是一块橡皮泥。矩阵乘法就是用这个变形器把橡皮泥捏成另一个形状。多个矩阵相乘就是连续用多个变形器捏橡皮泥。

三、最基础:向量组角度

矩阵可以看作是由一组向量(行向量或列向量)组成的,这个角度是理解线性空间、秩、线性相关性等概念的关键。

矩阵是什么?

  • 列向量视角:矩阵是一组列向量的集合
    [a b c] [d e f] = [列向量1, 列向量2, 列向量3] [g h i]
  • 行向量视角:矩阵是一组行向量的集合
    [a b c] [行向量1] [d e f] = [行向量2] [g h i] [行向量3]

矩阵运算的直观意义

  • 矩阵乘法(列向量视角)列向量的线性组合。矩阵 A 乘以向量 x,就是用 x 的元素作为系数,对 A 的列向量进行线性组合。
    [a b] [x1] = x1×[a] + x2×[b] [c d] [x2] [c] [d]
  • 矩阵乘法(行向量视角)行向量的线性组合。向量 y 乘以矩阵 A,就是用 y 的元素作为系数,对 A 的行向量进行线性组合。
  • 矩阵的秩线性无关的列向量(或行向量)的最大个数,也就是这些向量能张成的空间的维度。
  • 矩阵转置行向量和列向量互换

四、最实用:线性方程组角度

矩阵是解线性方程组的强大工具,这也是线性代数最初发展的动力之一。

矩阵是什么?

线性方程组可以写成Ax=b的形式,其中:

  • A 是系数矩阵,由方程组中未知数的系数组成
  • x 是未知数向量
  • b 是常数项向量

例子

2x + 3y = 8 4x - y = 2

可以写成:

[2 3] [x] = [8] [4 -1] [y] [2]

矩阵运算的直观意义

  • 解线性方程组:就是求向量 x,使得矩阵 A 作用在 x 上得到向量 b。
  • 逆矩阵:如果 A 可逆,那么 x=A⁻¹b,直接用逆矩阵就能解出方程组。
  • 行列式:如果 det (A)≠0,说明方程组有唯一解;如果 det (A)=0,说明方程组无解或有无穷多解。
  • 高斯消元法:通过对增广矩阵 [A|b] 进行初等行变换,将其化为行阶梯形,从而求解方程组。

五、最有趣:图论角度

矩阵可以用来表示图(由顶点和边组成的结构),这在网络分析、社交网络、交通规划等领域有广泛应用。

矩阵是什么?

  • 邻接矩阵:表示图中顶点之间的连接关系。如果顶点 i 到顶点 j 有一条边,那么矩阵的第 i 行第 j 列元素为 1,否则为 0。

例子:一个有 3 个顶点的有向图

顶点1 → 顶点2 顶点2 → 顶点3 顶点3 → 顶点1

它的邻接矩阵是:

[0 1 0] [0 0 1] [1 0 0]

矩阵运算的直观意义

  • 邻接矩阵的 k 次幂表示顶点之间长度为 k 的路径的数量。比如 A² 的第 i 行第 j 列元素,就是从顶点 i 到顶点 j 长度为 2 的路径的数量。
  • 矩阵加法:合并两个图的边。
  • 矩阵乘法:计算图的路径信息。

六、最前沿:信息编码角度

在数字时代,矩阵是信息的基本表示形式,几乎所有的数字信息都可以用矩阵来表示和处理。

矩阵是什么?

  • 图像:一张灰度图像就是一个矩阵,每个元素代表对应像素的亮度值(0-255)。彩色图像是三个这样的矩阵(红、绿、蓝通道)。
  • 声音:一段声音可以表示为一个向量(时间序列),而声音的频谱分析则用到矩阵变换(傅里叶变换)。
  • 文本:在自然语言处理中,文本可以表示为词向量矩阵,每行代表一个词的向量表示。

矩阵运算的直观意义

  • 图像旋转 / 缩放:用线性变换矩阵对图像的像素坐标进行变换。
  • 图像滤波:用卷积核(小矩阵)对图像矩阵进行卷积运算,实现模糊、锐化、边缘检测等效果。
  • 数据压缩:用矩阵的奇异值分解(SVD),保留最重要的信息,丢弃冗余信息。
  • 机器学习:几乎所有的机器学习模型都涉及大量的矩阵运算,比如神经网络的前向传播就是一系列矩阵乘法和激活函数的组合。

为什么要从多个角度看矩阵?

矩阵的强大之处在于它的多义性。同一个矩阵,在不同的场景下可以有不同的解释,而这些解释之间又是相互关联的。

比如,当你在计算机图形学中用矩阵旋转一个图像时,你既可以从线性变换角度理解它是一个旋转操作,也可以从数据表格角度理解它是对图像像素坐标数据的转换,还可以从向量组角度理解它是对基向量的旋转。

掌握了这些不同的角度,你就不会再把矩阵看作是一堆枯燥的数字,而是能看到它背后丰富的直观意义,从而更灵活地运用线性代数解决实际问题。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/23 7:15:59

英特尔现代代码开发挑战:实战性能优化与工具链应用指南

1. 项目概述:一场面向开发者的实战演练最近深度参与并复盘了英特尔举办的“现代代码开发挑战”网络研讨会,感触颇深。这远不止是一场普通的技术分享会,而是一个精心设计的、让开发者亲手“触摸”现代硬件性能潜力的实战沙盒。如果你是一名C/C…

作者头像 李华
网站建设 2026/5/23 7:08:02

铁路局信息化综合管理平台总体设计方案

一、五层架构支撑全域智能化 平台以感知、网络、数据、平台、应用五层架构贯通铁路资源数字化链路,为铁路局打造横向到边、纵向到底的智能化管理底座。 应用层-业务功能模块–物资仓储、卧具跟踪、工具管理、档案管理等业务功能模块 平台层-微服务与技术中心–提…

作者头像 李华
网站建设 2026/5/23 7:03:36

Deepseek-V4-Flash 高效能应用场景实战指南

在处理大规模数据流或高并发请求时,开发者往往面临一个两难选择:是牺牲响应速度换取深度推理能力,还是为了毫秒级延迟而放弃复杂的逻辑处理?特别是在构建面向 C 端用户的应用时,用户体验的流畅度直接决定了产品的生死。…

作者头像 李华
网站建设 2026/5/23 7:01:09

育秧基质的标准化:为什么同一盘苗的秧苗可以长得一样齐?

在传统育苗中,一个常见的困扰是:同一盘苗中,有的已经长到三叶一心,有的才刚露两叶一心的尖。这种生长不一致的情况,到移栽后会造成大田秧苗大小参差、群体生长不均衡,最终影响产量。育秧基质的标准化是解决…

作者头像 李华
网站建设 2026/5/23 7:00:04

agent开发小结

agent初步开发小结 新奇的agent一开始让人觉得是很高大上的东西,但其实了解和开发agent并不是太复杂。 一.agent的原理 agent的本质就是APItools,API使得大模型可以在本地使用,但是也仅限于chatbot一样的聊天功能,让它去访问和…

作者头像 李华
网站建设 2026/5/23 6:55:01

2026年AI编程工具综合对比:主流工具横评

2026年AI编程工具综合对比:主流工具横评在2026年5月最新实测中,Trae以9.7的综合评分领跑主流AI编程工具,其永久免费策略与98%的代码生成准确率,成为国内开发者的核心选择。当前AI编程工具已从单一补全进化为全链路开发平台&#x…

作者头像 李华