news 2026/5/1 11:47:13

深度学习基础术语介绍:标量和向量

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
深度学习基础术语介绍:标量和向量

本文博主将通俗地解释一下标量向量。它们是构建张量世界乃至整个数学和物理世界最基础的“乐高积木”。


1. 标量 ——“单一的量”

一句话概括:标量就是一个只有大小,没有方向的“单个数字”。

  • 它是什么?

    • 标量是零维张量。它没有长度、宽度、高度,就是一个点,一个独立的数值。
    • 这个数值可以代表任何单一属性的
    • 例子
      • 温度:25℃(只表示“多热”,不表示热量往哪个方向传播)
      • 质量:60kg
      • 价格:¥99.99
      • 长度:1.75m
      • 损失值:0.314(在深度学习中,模型预测的总误差)
  • 核心特性

    • 只有大小,没有方向。
    • 遵循普通的算术法则(加减乘除)。
  • 通俗比喻

    • 单一维度的信息:就像你手机电池显示的百分比78%,它只告诉你一个事——“还剩多少电”。它是一个孤立的数值。
    • 一个音符:一个单独的音符(比如中央C),它有音高这个属性,但它自己无法构成旋律。
    • 一个数据点:在一项调查中,一个人的年龄28,这个28就是一个标量。

2. 向量 ——“有序的列表”

一句话概括:向量是一组有序排列的标量,它不仅有大小,还隐含着方向或一组相互关联的特征。

  • 它是什么?

    • 向量是一维张量。你可以把它想象成一行或一列数字。
    • 它表示一个多元有方向的量。向量中的每一个位置都有特定含义。
    • 数学表示:通常写作v = [v₁, v₂, v₃, ...]或列的形式。
    • 例子
      1. 空间中的位移/速度(最经典的物理向量):
        • 位移:[向东5米, 向北3米]。这不仅仅是走了√(5²+3²)≈5.83米(大小),还明确指出了方向(东偏北约31度)。
      2. 一个人的特征向量(在机器学习中无处不在):
        • [身高1.75, 体重65, 年龄28]
        • 这个向量有序地描述了同一个对象的三个不同属性。位置1固定是身高,位置2固定是体重。
      3. 单词的嵌入向量(在NLP中):
        • 单词“猫”可能被表示为[0.2, -0.5, 0.9, ..., 0.1](一个300维的向量)。这个高维向量编码了“猫”的语义。
      4. 神经网络的一层输出
        • 一个全连接层有128个神经元,它的输出就是一个128维的向量,每个数字代表一个神经元“激活”的程度。
  • 核心特性

    • 有序性[身高, 体重][体重, 身高]是两个不同的向量。
    • 有大小(模长)和方向(在物理和几何意义上)。在机器学习中,“方向”常被理解为在特征空间中的一个点或一个指向
    • 可以进行丰富的运算:加法、点积(内积,用于衡量相似性)、叉积等。
  • 通俗比喻

    • 一个完整的地址:地址[“中国”, “北京市”, “海淀区”, “中关村大街”, “27号”]就是一个向量。它不止告诉你一个信息,而且信息的顺序至关重要
    • 一行乐谱:一小节乐谱[C, E, G](一个和弦),它是一个音符的有序组合,形成了一个有意义的音乐单元。这比一个孤立的音符信息量大得多。
    • 游戏角色的属性面板[力量:85, 敏捷:60, 智力:20, 生命值:300]。这组有序的数字完整地定义了这个角色此刻的状态。
    • 坐标系中的一个箭头(最直观):从原点(0,0)指向点(5,3)的箭头,就是一个向量[5,3]。它的长度是大小,箭头指向就是方向。

标量 vs. 向量:关键区别与联系

特性标量向量
维度零维(一个点)一维(一条线/一个列表)
信息量单一属性多个有序属性 或一个带方向的量
数学实体单个数字数字的有序数组
几何意义数轴上的一个点空间中的一个有向箭头(或一个点)
深度学习中的角色损失值、学习率等单一超参数一层神经元的激活值、一个样本的特征表示、权重矩阵的一行/一列
运算普通算术向量加法、点积、与标量的乘法等

它们的关系

  • 向量是由标量作为元素组成的。
  • 一个1维的向量,可以看作多个标量的有序打包。
  • 在深度学习中,一个样本的特征通常用向量表示,整个数据集则用矩阵或更高维张量表示。

进阶一步:升维理解

如果把标量看作一个音符,那么向量就是一小节旋律
如果把标量看作一个像素的亮度,那么向量就可以是一行像素的亮度,或者一个像素点的RGB颜色值[R, G, B]

理解标量和向量是理解矩阵(二维张量)和张量(N维数组)的基础。在深度学习的计算中,向量化运算(对整个向量或矩阵进行操作,而非对单个标量循环)是GPU能够实现惊人加速的关键。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 11:46:54

深度学习基础术语介绍:最大池化层与下采样

一句话概括 最大池化是下采样的一种具体实现方式,它的作用是把特征图"浓缩",保留最显著的特征,同时缩小尺寸、减少计算量。1. 直观理解:最大池化是什么? 想象你在看一张高清照片,现在你需要向别人…

作者头像 李华
网站建设 2026/5/1 10:19:31

零基础教程:用Python写你的第一个USB查看器

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个面向初学者的USB设备查看器教程项目。代码应简单易懂,包含详细注释,逐步讲解如何使用Python的PyUSB库检测USB设备。功能包括:列出所有连…

作者头像 李华
网站建设 2026/4/30 14:39:55

AI如何帮你自动生成Freemarker模板?快马平台实战

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 请帮我生成一个Freemarker(FTL)模板,用于电商网站的商品详情页展示。要求包含商品名称、价格、图片、规格参数表格、用户评价区域。使用Bootstrap 5框架实现响应式布局&…

作者头像 李华
网站建设 2026/4/28 6:59:16

绿酿新章:酒水行业ESG的全球实践与中国路径

一瓶茅台酒的生产耗水占其全生命周期水足迹的91.42%,这组数据揭开了酒水行业ESG转型的核心命题——当“双碳”目标成为全球共识,ESG(环境、社会、治理)已从企业社会责任报告的边缘话题,升级为重塑行业竞争力的核心要素…

作者头像 李华
网站建设 2026/5/1 1:58:46

MQ生产者确认机制捕获到消息投递失败后如何重试?

要实现生产者确认机制失败后自动重试重新投递,核心思路是:将发送失败的消息暂存→按策略重试→跟踪重试状态→失败兜底。以下是具体实现思路和关键步骤,结合代码示例说明。一、核心思路框架当生产者通过 ConfirmCallback 收到 ackfalse&#…

作者头像 李华
网站建设 2026/5/1 5:09:47

5分钟用AI创建一个RGBA调色板应用

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 快速生成一个RGBA调色板应用,功能包括:1) 颜色选择器 2) 调色板保存 3) 颜色代码复制 4) 分享功能 5) 历史记录。要求响应式设计,支持PWA安装。使…

作者头像 李华