news 2026/6/15 14:40:36

探究nn.Linear和nn.Conv2d的基本用法

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
探究nn.Linear和nn.Conv2d的基本用法

1问题

1.如何在pytorch中使用nn.Linear?

2.如何在pytorch环境中运用nn.Conv2d?

2 方法

1.首先在网上查询了关于nn.Linear的含义。PyTorch的nn.Linear()是用于设置网络中的全连接层的,需要注意在二维图像处理的任务中,全连接层的输入与输出一般都设置为二维张量,形状通常为[batch_size, size],不同于卷积层要求输入输出是四维张量。其中in_features指的是输入的二维张量的大小,即输入的[batch_size, size]中的size。out_features指的是输出的二维张量的大小,即输出的二维张量的形状为[batch_size,output_size],当然,它也代表了该全连接层的神经元个数。
从输入输出的张量的shape角度来理解,相当于一个输入为[batch_size, in_features]的张量变换成了[batch_size, out_features]的输出张量。

  1. Conv2d是用来实现2d卷积操作的,其中:

in_channels 表示输入的channels数

out_channels 表示输出的channels数,

kernel_size 表示卷积核的尺寸,可以是方形卷积核、也可以不是,下边example可以看到

stride 表示 步长,用来控制卷积核移动间隔

padding 表示输入边沿扩边操作

import torch
from torch import nn
conv1 = nn.Conv2d(
in_channels=3, #输入通道数
#每个卷积核的通道数与输入通道数相同
#卷积运算后得到128张特征图
out_channels=128, #输出通道数,表示当前卷积层有128个卷积核
kernel_size=3, #卷积核大小3x3
stride=1, #步长,每次滑动窗口移动的长度,默认为1
)
fc1 = nn.Linear(
in_features=128*26*26, #前一层拉伸后的向量大小
out_features=10,
)
x = torch.rand(size=(32,3,28,28))
x = conv1(x)
x = torch.flatten(x,1) #二维的特征图与全连接进行连接时需要拉伸
x = fc1(x)
#[32,3,28,28] -> [32,32,26,26]
print(x.shape)

输出:

3结语

针对探究nn.Linear问题,其用于设置网络中的全连接层的,需要注意在二维图像处理的任务中,全连接层的输入与输出一般都设置为二维张量,其中参数in_features指的是输入的二维张量的大小,即输入的[batch_size, size]中的size。out_features指的是输出的二维张量的大小。

针对nn.Conv2d问题,其用法是用来实现2d卷积操作的,其中包含了许多用于卷积的参数,in_channels、out_channels和kernel_size是需要手动提供的,而其他的参数是有默认值。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/14 0:38:55

LobeChat安全性评估:数据隐私保护如何做到位?

LobeChat安全性评估:数据隐私保护如何做到位? 在企业越来越依赖人工智能处理敏感业务的今天,一个看似简单的问题却成了技术决策的关键瓶颈:我们能不能放心地让AI“看到”内部资料?尤其是当主流大模型服务要求将数据上传…

作者头像 李华
网站建设 2026/6/12 12:57:15

CSS 伪类 after 清除浮动:前端老手都在用的布局妙招

CSS 伪类 after 清除浮动:前端老手都在用的布局妙招 CSS 伪类 after 清除浮动:前端老手都在用的布局妙招引言:那些年我们一起追过的浮动为什么清除浮动这么让人头疼CSS 伪类 after 是什么神仙操作深入剖析 clearfix 技术背后的原理after 伪元…

作者头像 李华
网站建设 2026/6/12 19:32:37

EmotiVoice语音合成在心理咨询机器人中的应用潜力

EmotiVoice语音合成在心理咨询机器人中的应用潜力 在心理健康服务资源日益紧张的今天,越来越多的人面临情绪困扰却难以获得及时、私密的心理支持。传统的面对面咨询受限于专业人力和地理分布,而数字疗法正在成为重要补充。其中,心理咨询机器人…

作者头像 李华
网站建设 2026/6/12 18:31:23

从100到10万:OpenIM Server如何支撑元宇宙大规模实时通信

虚拟演唱会中10万人同时发送弹幕、元宇宙社交平台中上千个虚拟角色实时互动、跨终端设备无缝同步消息状态——这些场景正成为下一代互联网的标准配置。然而传统IM系统在支撑大规模实时通信时面临三大核心挑战:连接数瓶颈导致系统崩溃、消息延迟超过300ms影响用户体验…

作者头像 李华
网站建设 2026/6/15 14:16:23

免费开源屏幕录制神器:vokoscreenNG 2024终极指南

免费开源屏幕录制神器:vokoscreenNG 2024终极指南 【免费下载链接】vokoscreenNG vokoscreenNG is a powerful screencast creator in many languages to record the screen, an area or a window (Linux only). Recording of audio from multiple sources is suppo…

作者头像 李华