news 2026/5/29 23:54:36

原始数据—>张量转换后会丢失原始数据吗

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
原始数据—>张量转换后会丢失原始数据吗

学习李沐香蕉目标检测时疑问

原始数据 → 张量的转换链路(全程可回溯):

1. 图像原始数据的转换链路
硬盘上的.png文件(原始数据) ↓ 由torchvision.io.read_image读取 单个图像张量(uint8,[C,H,W])→ 存入images列表 ↓ 在BananasDataset的__getitem__中 转为float32张量(模型可训练)

张量和原始图片是一一对应的数值映射

比如原始图片中 (100,200) 像素的 RGB 值是 (255,0,0),张量中img[0,100,200]=255(R 通道)、img[1,100,200]=0(G 通道)、img[2,100,200]=0(B 通道)。

若要还原为 “可视化的原始图片”,只需将张量转格式即可:

# 从images列表中取第一个图像张量(还原原始图片) img_tensor = train_dataset.features[0] # uint8张量,[3,H,W] # 步骤1:转置为[H,W,C](Matplotlib可视化格式) img_np = img_tensor.permute(1,2,0).numpy() # 步骤2:显示原始图片(和硬盘上的.png文件完全一致) d2l.plt.imshow(img_np)
2. 标签原始数据的转换链路
CSV文本文件(原始标注:img_name,label,xmin,ymin,xmax,ymax) ↓ 由pd.read_csv读取为DataFrame(文本→数字) ↓ 转为list(target)([0,100,80,200,180]) ↓ torch.tensor(targets).unsqueeze(1) 标签张量(float32,[N,1,5])

张量中的数值就是 CSV 里的原始数字(只是维度适配),比如张量labels[0] = [[0,100,80,200,180]],对应 CSV 中00001.png的标注:label=0, xmin=100, ymin=80, xmax=200, ymax=180

若要还原为 “原始 CSV 格式”,只需将张量转回 DataFrame:

# 从标签张量还原原始标注 labels_np = train_dataset.labels.squeeze(1).numpy() # [N,5] csv_raw = pd.DataFrame( labels_np, columns=['label','xmin','ymin','xmax','ymax'] ) # 添加img_name列(从CSV中读取的原始图像名) csv_raw['img_name'] = csv_data.index print(csv_raw) # 和原始CSV文件内容完全一致

为什么代码不返回 “原始数据”(文件 / 文本)?

PyTorch 模型训练的核心是数值计算,原始的.png 文件(二进制)、CSV 文本(字符串)无法直接输入模型 —— 必须转为张量(数值矩阵):

  1. 图像张量:是原始图片像素的数值化表示,可参与梯度计算、卷积等操作;
  2. 标签张量:是原始标注的数值化表示,可用于计算损失(如边界框回归损失)。
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/29 20:57:53

Qwen3-32B模型幻觉问题初探

Qwen3-32B的幻觉问题,真不能忽视 试了下Qwen3-32B,第一反应是:这模型太强了。 响应快、逻辑顺、写代码像资深工程师,回答专业问题也一套一套的。你几乎要以为它真“懂”了——理解语义、掌握知识、会推理,甚至能帮你设…

作者头像 李华
网站建设 2026/5/25 9:27:59

【2025年最新】史上最全网络安全面试题+答案

1、什么是SQL注入攻击 前端代码未被解析被代入到数据库导致数据库报错 2、什么是XSS攻击 跨站脚本攻击 在网页中嵌入客户端恶意脚本,常用s语言,也会用其他脚本语言 属于客户端攻击,受害者是用户,网站管理员也属于用户&#xf…

作者头像 李华
网站建设 2026/5/7 14:56:52

15秒创作一首歌?AI音乐模型ACE-Step体验

AI音乐的民主化革命:从一个念头到一首歌只需15秒 你有没有过这样的时刻?某个瞬间的情绪涌上心头——地铁站里擦肩而过的背影、深夜加班时窗外的雨滴、童年老屋前那棵槐树——你多希望有一段旋律能替你说出这些无法言说的感受。但你不会作曲,不…

作者头像 李华
网站建设 2026/5/30 11:58:10

茶多酚检测仪:茶饮与食品功能成分精准质控的核心工具与技术研究

一、 引言:茶多酚的价值内涵与量化检测的时代需求茶多酚,作为茶叶中主要的功能性活性成分,是决定茶叶及其衍生品(如茶饮料、茶食品)风味、色泽以及健康价值的关键物质。它不仅具有天然的抗氧化、抗菌等特性&#xff0c…

作者头像 李华
网站建设 2026/5/29 23:01:29

5分钟搞定时序数据可视化:让时间序列分析变得像聊天一样简单

还在为那些密密麻麻的时间戳数据发愁吗?🤔 每天面对Excel里成百上千行的时间序列数据,却不知道怎么快速看出趋势、发现规律?今天我要给你介绍一个神器——Data Formulator,这个由微软研究院开发的AI驱动的数据可视化工…

作者头像 李华
网站建设 2026/5/25 19:07:29

Docker部署Stable Diffusion 3.5-FP8全指南

Docker部署Stable Diffusion 3.5-FP8全指南 你有没有过这样的经历:满怀期待地下载了最新的 Stable Diffusion 模型,结果刚运行就报错“CUDA out of memory”?或者好不容易配好了环境,换一台机器又得从头再来一遍?更别…

作者头像 李华