news 2026/5/19 0:45:37

Day 43图像数据与显存机制@浙大疏锦行

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Day 43图像数据与显存机制@浙大疏锦行

Day 43 学习笔记:图像数据与显存机制@浙大疏锦行

一、 图像数据基础

  1. 数据形状 (Shape)

    • 结构化数据(样本数, 特征数)

    • 图像数据

      (通道数, 高, 宽)

      PyTorch 默认格式 (Channel First)

      • 灰度图(如 MNIST):通道数 = 1
      • 彩色图(如 CIFAR-10):通道数 = 3 (RGB)
  2. 维度陷阱

    • PyTorch使用(C, H, W)
    • Matplotlib/OpenCV通常使用(H, W, C)
    • 注意:在使用plt.imshow()可视化 PyTorch 张量时,必须先使用np.transposepermute交换维度顺序。

二、 图像神经网络 (MLP) 定义

  1. 展平操作 (Flatten)
    • MLP 全连接层只能接收一维向量。
    • 必须在输入层前使用nn.Flatten()x.view()(C, H, W)拉平为(C×H×W)的一维向量。
  2. Batch Size 与模型定义
    • 模型定义阶段无关nn.Linear等层定义时不涉及 Batch Size。
    • 数据加载阶段相关DataLoader中设置 Batch Size。
    • 前向传播:PyTorch 会自动处理第一维度的 Batch,模型内部计算逻辑不变。

三、 显存 (VRAM) 占用分析

显存不仅仅用来存图片,主要由以下4部分组成:

组成部分说明估算公式 (Float32)
1. 模型参数模型的权重 (Weights) 和偏置 (Bias)参数量 ×× 4 Bytes
2. 梯度反向传播计算出的导数≈≈ 参数量 ×× 4 Bytes
3. 优化器状态优化器更新参数所需的额外信息SGD: 0
Adam: ≈≈ 参数量 ×× 8 Bytes (动量+方差)
4. 中间变量 & 数据输入数据 + 每一层的输出特征图 (Activations)受 Batch Size 影响最大
Batch Size ×× (单样本大小 + 中间层大小)

结论:模型参数和优化器占用是固定的(这也是为什么大模型很难跑起来),而调整 Batch Size 是控制显存占用的主要手段

四、 Batch Size 的选择策略

  1. 显存限制 (OOM)
    • Batch Size 设置过大会导致Out Of Memory
    • 建议从 16, 32, 64 开始尝试,通常设置为显卡最大承载能力的80%左右。
  2. 对训练的影响
    • Batch Size = 1:梯度随机性大,震荡剧烈,难以收敛。
    • Batch Size 较大:利用矩阵并行计算加速;梯度是多个样本的平均值,方向更准,训练更稳定。

@浙大疏锦行

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/14 20:56:22

Linly-Talker支持多实例并行处理提高吞吐量

Linly-Talker 多实例并行处理:突破数字人系统吞吐瓶颈 在直播带货的深夜,一个电商平台同时运行着上百个直播间——每个房间都有一位不知疲倦的虚拟主播,在镜头前流畅讲解商品特性。这些数字人并非预先录制的视频,而是实时响应用户…

作者头像 李华
网站建设 2026/5/11 11:21:43

4、Windows 2000 活动目录入门教程

Windows 2000 活动目录入门教程 1. 活动目录概述 活动目录(Active Directory)是 Windows 2000 服务器的目录服务,它本质上是一个多主数据库,将用户账户和网络资源信息存储在可扩展存储引擎(ESE)数据库中。其强大之处在于能通过组策略和访问权限将用户账户与资源关联起来…

作者头像 李华
网站建设 2026/5/11 22:27:52

10、Windows 2000 域实施全解析

Windows 2000 域实施全解析 1. 域实施概述 在完成域结构设计后,就可以依据设计策略进行实施。大型 Windows 2000 实施项目可能涉及不同角色的团队,安装团队在将服务器安装到域之前,应仔细审查设计文档并确保理解。若安装团队和设计团队不一致,业务目标可解决双方的意见分…

作者头像 李华
网站建设 2026/5/5 9:07:55

Linly-Talker支持API调用返回JSON格式状态信息

Linly-Talker支持API调用返回JSON格式状态信息 在内容创作正经历自动化革命的今天,数字人已不再是科幻电影中的概念,而是逐渐成为企业培训、在线教育、电商直播等场景中真实可用的技术工具。然而,大多数数字人系统仍停留在“黑盒运行”阶段—…

作者头像 李华
网站建设 2026/5/9 11:17:21

21、Windows 7 电脑维护、更新与故障排除全攻略

Windows 7 电脑维护、更新与故障排除全攻略 一、Windows 7 电脑维护概述 照顾好你的 Windows 7 电脑是一件相当简单的事情,但就像生活中的其他事情一样,它需要你定期给予一些关注。日常维护工作中,Windows 7 可以在你设置后自动为你执行定期检查 Windows 更新的任务。另外…

作者头像 李华
网站建设 2026/5/12 22:36:53

18、Windows 10远程协助与启动修复全攻略

Windows 10远程协助与启动修复全攻略 1. 远程协助 在公司环境中,无需发送远程协助邀请也能使用远程协助功能。不过,这需要在组策略中进行配置,你可以通过在开始菜单或Cortana中搜索“gpedit”来打开组策略编辑器。 这种远程协助请求被称为主动请求,出于安全考虑,Window…

作者头像 李华