当前位置: 首页 > news >正文

6-4 多输入多输出通道

1.多输入通道

import torch
from d2l import torch as d2l
def corr2d_multi_in(X, K):# 先遍历 X 和 K 的第0个维度(通道维度),再把他们加在一起# 把所有配对得到的互相关结果逐元素相加,得到一个总的输出特征图。# 把输入列表 X 和核列表 K 按位置配对,返回一个迭代器,每次取出一个 (x, k) 对。return sum(d2l.corr2d(x, k) for x, k in zip(X, K))
# 构造输入张量X和核张量K
X = torch.tensor([[[0.0, 1.0, 2.0], [3.0, 4.0, 5.0],[6.0, 7.0, 8.0]],[[1.0, 2.0, 3.0], [4.0, 5.0, 6.0], [7.0, 8.0, 9.0]]])
K = torch.tensor([[[0.0, 1.0], [2.0, 3.0]],[[1.0, 2.0],[3.0, 4.0]]])corr2d_multi_in(X, K)
tensor([[ 56.,  72.],[104., 120.]])

2.多输出通道

代码片段 含义
K 是一个 list of kernels,即 K = [k0, k1, …, k_{out-1}],每个 k_i 是一个 多通道核(形状为 (C_in, kH, kW))。
corr2d_multi_in(X, k) 对多通道输入 X(形状 (C_in, H, W))和多通道核 k 做“多输入单输出”的卷积,返回一个 2-D 特征图(形状 (H_out, W_out))。
[corr2d_multi_in(X, k) for k in K] 用每个核 k 都算一次,得到 len(K) 个 2-D 特征图,组成一个 list of 2-D tensors
torch.stack(..., 0) 把这些 2-D 张量沿着 第 0 维(新维度) 堆叠,形成一个 3-D 张量,形状为 (C_out, H_out, W_out),其中 C_out = len(K)
def corr2d_multi_in_out(X, K):# 迭代 K 的第0个维度,每次都对输入 X 执行互相关运算# 最后将所有结果都叠加在一起return torch.stack([corr2d_multi_in(X, k) for k in K], 0)
K = torch.stack((K, K+1, K+2), 0)
K.shape
torch.Size([3, 2, 2, 2])
corr2d_multi_in_out(X, K)
tensor([[[ 56.,  72.],[104., 120.]],[[ 76., 100.],[148., 172.]],[[ 96., 128.],[192., 224.]]])

1x1 卷积层

def corr2d_multi_in_out_1x1(X, K):c_i, h, w = X.shapec_o = K.shape[0]X = X.reshape((c_i, h*w))K = K.reshape((c_o, c_i))# 全连接层中的矩阵乘法Y = torch.matmul(K, X)return Y.reshape((c_o, h, w))
  1. X = torch.normal(0, 1, (3, 3, 3))
  • 从标准正态分布 N(0,1) 里随机采样
  • 得到一个 3×3×3 的张量
  • 含义:3 个通道,每个通道是 3×3 的 feature map
    形状等价于 (C_in, H, W) = (3, 3, 3)
  1. K = torch.normal(0, 1, (2, 3, 1, 1))
  • 同样从 N(0,1) 采样
  • 得到一个 2×3×1×1 的张量
  • 含义:2 个卷积核,每个核有 3 个通道,大小是 1×1
    形状等价于 (C_out, C_in, kH, kW) = (2, 3, 1, 1)
# 验证
X = torch.normal(0, 1, (3, 3, 3))
K = torch.normal(0, 1, (2, 3, 1, 1))
Y1 = corr2d_multi_in_out_1x1(X, K)
Y2 = corr2d_multi_in_out(X, K)
assert float(torch.abs(Y1-Y2).sum()) < 1e-16
print(Y1)
print(Y2)
tensor([[[-0.1984,  2.5553,  1.5839],[-0.2058,  1.2268, -0.9894],[ 0.2426, -0.1919, -1.0239]],[[-0.4502, -2.3320, -0.1471],[-0.0087,  0.0856,  1.3771],[-0.5613, -2.6421,  0.3126]]])
tensor([[[-0.1984,  2.5553,  1.5839],[-0.2058,  1.2268, -0.9894],[ 0.2426, -0.1919, -1.0239]],[[-0.4502, -2.3320, -0.1471],[-0.0087,  0.0856,  1.3771],[-0.5613, -2.6421,  0.3126]]])

http://www.hskmm.com/?act=detail&tid=12594

相关文章:

  • 6-6 卷积神经网络LeNet
  • 5-5读写文件
  • 6-2图像卷积
  • 二叉树的高度和判断平衡二叉树
  • 20250921 之所思 - 人生如梦
  • UE5 Cook数据结构
  • 通过微信对客服系统客户进行消息提醒,比如客户快过期了,访客发来的消息也是通过模板消息通知给客服
  • WPF治具软件模板分享 - Dragonet
  • 时间复杂度
  • 基于WOA鲸鱼优化的XGBoost序列预测算法matlab仿真
  • 软件工程第二次作业——个人项目
  • 微信扫码二维码,关注绑定公众号提醒,利用微信公众号的模板消息进行消息通知的推送
  • Arch下实现人脸识别登录:howdy的配置与使用
  • Salephpscripts Web_Directory_Free SQL注入漏洞利用分析(CVE-2024-3552)
  • 12306高并发架构设计:基于区间计数器的网关层拒单方案
  • 各位同学,大家好!我想请大家回忆一段我们在刘集中学的故事,和我单独联系。我想把这些故事写出来保存。欢迎与我分享!谢谢!
  • 实用指南:centos sshd:xxx.xxx.xxx.xxx:allow 如何设置
  • vite7-vue3-os网页os管理|vue3+vite7+arco.design网页pc版webos系统
  • 高并发高吞吐量
  • 服务降级
  • 镜像制作
  • 20231427田泽航第二周预习报告
  • 近期 CF 题不怎么做
  • Day24_【深度学习—广播机制】 - 详解
  • IAR Embedded Workbench中的MCU启动过程分析
  • CSP-S 2025
  • 别样的CSP-S初赛大战(又名:我和油一的那些年)
  • 在ubuntu系统的c语言程序
  • springboot2整合dynamic-datasource-spring-boot-starter多数据源
  • 赛前训练2 extra 思维与构造