当前位置：首页 > news >正文

6-4 多输入多输出通道

news 2025/9/21 23:40:44

1.多输入通道

import torch
from d2l import torch as d2l
def corr2d_multi_in(X, K):# 先遍历 X 和 K 的第0个维度（通道维度），再把他们加在一起# 把所有配对得到的互相关结果逐元素相加，得到一个总的输出特征图。# 把输入列表 X 和核列表 K 按位置配对，返回一个迭代器，每次取出一个 (x, k) 对。return sum(d2l.corr2d(x, k) for x, k in zip(X, K))

# 构造输入张量X和核张量K
X = torch.tensor([[[0.0, 1.0, 2.0], [3.0, 4.0, 5.0],[6.0, 7.0, 8.0]],[[1.0, 2.0, 3.0], [4.0, 5.0, 6.0], [7.0, 8.0, 9.0]]])
K = torch.tensor([[[0.0, 1.0], [2.0, 3.0]],[[1.0, 2.0],[3.0, 4.0]]])corr2d_multi_in(X, K)

tensor([[ 56.,  72.],[104., 120.]])

2.多输出通道

代码片段	含义
`K`	是一个 list of kernels，即 `K = [k0, k1, …, k_{out-1}]`，每个 `k_i` 是一个多通道核（形状为 `(C_in, kH, kW)`）。
`corr2d_multi_in(X, k)`	对多通道输入 `X`（形状 `(C_in, H, W)`）和多通道核 `k` 做“多输入单输出”的卷积，返回一个 2-D 特征图（形状 `(H_out, W_out)`）。
`[corr2d_multi_in(X, k) for k in K]`	用每个核 `k` 都算一次，得到 `len(K)` 个 2-D 特征图，组成一个 list of 2-D tensors。
`torch.stack(..., 0)`	把这些 2-D 张量沿着第 0 维（新维度）堆叠，形成一个 3-D 张量，形状为 `(C_out, H_out, W_out)`，其中 `C_out = len(K)`。

def corr2d_multi_in_out(X, K):# 迭代 K 的第0个维度，每次都对输入 X 执行互相关运算# 最后将所有结果都叠加在一起return torch.stack([corr2d_multi_in(X, k) for k in K], 0)

K = torch.stack((K, K+1, K+2), 0)
K.shape

torch.Size([3, 2, 2, 2])

corr2d_multi_in_out(X, K)

tensor([[[ 56.,  72.],[104., 120.]],[[ 76., 100.],[148., 172.]],[[ 96., 128.],[192., 224.]]])

1x1 卷积层

def corr2d_multi_in_out_1x1(X, K):c_i, h, w = X.shapec_o = K.shape[0]X = X.reshape((c_i, h*w))K = K.reshape((c_o, c_i))# 全连接层中的矩阵乘法Y = torch.matmul(K, X)return Y.reshape((c_o, h, w))

X = torch.normal(0, 1, (3, 3, 3))

从标准正态分布 N(0,1) 里随机采样
得到一个 3×3×3 的张量
含义：3 个通道，每个通道是 3×3 的 feature map
形状等价于 (C_in, H, W) = (3, 3, 3)

K = torch.normal(0, 1, (2, 3, 1, 1))

同样从 N(0,1) 采样
得到一个 2×3×1×1 的张量
含义：2 个卷积核，每个核有 3 个通道，大小是 1×1
形状等价于 (C_out, C_in, kH, kW) = (2, 3, 1, 1)

# 验证
X = torch.normal(0, 1, (3, 3, 3))
K = torch.normal(0, 1, (2, 3, 1, 1))

Y1 = corr2d_multi_in_out_1x1(X, K)
Y2 = corr2d_multi_in_out(X, K)
assert float(torch.abs(Y1-Y2).sum()) < 1e-16
print(Y1)
print(Y2)

tensor([[[-0.1984,  2.5553,  1.5839],[-0.2058,  1.2268, -0.9894],[ 0.2426, -0.1919, -1.0239]],[[-0.4502, -2.3320, -0.1471],[-0.0087,  0.0856,  1.3771],[-0.5613, -2.6421,  0.3126]]])
tensor([[[-0.1984,  2.5553,  1.5839],[-0.2058,  1.2268, -0.9894],[ 0.2426, -0.1919, -1.0239]],[[-0.4502, -2.3320, -0.1471],[-0.0087,  0.0856,  1.3771],[-0.5613, -2.6421,  0.3126]]])

查看全文

http://www.hskmm.com/?act=detail&tid=12594