1.多输入通道
import torch
from d2l import torch as d2l
def corr2d_multi_in(X, K):# 先遍历 X 和 K 的第0个维度(通道维度),再把他们加在一起# 把所有配对得到的互相关结果逐元素相加,得到一个总的输出特征图。# 把输入列表 X 和核列表 K 按位置配对,返回一个迭代器,每次取出一个 (x, k) 对。return sum(d2l.corr2d(x, k) for x, k in zip(X, K))
# 构造输入张量X和核张量K
X = torch.tensor([[[0.0, 1.0, 2.0], [3.0, 4.0, 5.0],[6.0, 7.0, 8.0]],[[1.0, 2.0, 3.0], [4.0, 5.0, 6.0], [7.0, 8.0, 9.0]]])
K = torch.tensor([[[0.0, 1.0], [2.0, 3.0]],[[1.0, 2.0],[3.0, 4.0]]])corr2d_multi_in(X, K)
tensor([[ 56., 72.],[104., 120.]])
2.多输出通道
代码片段 |
含义 |
K |
是一个 list of kernels,即 K = [k0, k1, …, k_{out-1}] ,每个 k_i 是一个 多通道核(形状为 (C_in, kH, kW) )。 |
corr2d_multi_in(X, k) |
对多通道输入 X (形状 (C_in, H, W) )和多通道核 k 做“多输入单输出”的卷积,返回一个 2-D 特征图(形状 (H_out, W_out) )。 |
[corr2d_multi_in(X, k) for k in K] |
用每个核 k 都算一次,得到 len(K) 个 2-D 特征图,组成一个 list of 2-D tensors。 |
torch.stack(..., 0) |
把这些 2-D 张量沿着 第 0 维(新维度) 堆叠,形成一个 3-D 张量,形状为 (C_out, H_out, W_out) ,其中 C_out = len(K) 。 |
def corr2d_multi_in_out(X, K):# 迭代 K 的第0个维度,每次都对输入 X 执行互相关运算# 最后将所有结果都叠加在一起return torch.stack([corr2d_multi_in(X, k) for k in K], 0)
K = torch.stack((K, K+1, K+2), 0)
K.shape
torch.Size([3, 2, 2, 2])
corr2d_multi_in_out(X, K)
tensor([[[ 56., 72.],[104., 120.]],[[ 76., 100.],[148., 172.]],[[ 96., 128.],[192., 224.]]])
1x1 卷积层
def corr2d_multi_in_out_1x1(X, K):c_i, h, w = X.shapec_o = K.shape[0]X = X.reshape((c_i, h*w))K = K.reshape((c_o, c_i))# 全连接层中的矩阵乘法Y = torch.matmul(K, X)return Y.reshape((c_o, h, w))
X = torch.normal(0, 1, (3, 3, 3))
- 从标准正态分布 N(0,1) 里随机采样
- 得到一个 3×3×3 的张量
- 含义:3 个通道,每个通道是 3×3 的 feature map
形状等价于 (C_in, H, W) = (3, 3, 3)
K = torch.normal(0, 1, (2, 3, 1, 1))
- 同样从 N(0,1) 采样
- 得到一个 2×3×1×1 的张量
- 含义:2 个卷积核,每个核有 3 个通道,大小是 1×1
形状等价于 (C_out, C_in, kH, kW) = (2, 3, 1, 1)
# 验证
X = torch.normal(0, 1, (3, 3, 3))
K = torch.normal(0, 1, (2, 3, 1, 1))
Y1 = corr2d_multi_in_out_1x1(X, K)
Y2 = corr2d_multi_in_out(X, K)
assert float(torch.abs(Y1-Y2).sum()) < 1e-16
print(Y1)
print(Y2)
tensor([[[-0.1984, 2.5553, 1.5839],[-0.2058, 1.2268, -0.9894],[ 0.2426, -0.1919, -1.0239]],[[-0.4502, -2.3320, -0.1471],[-0.0087, 0.0856, 1.3771],[-0.5613, -2.6421, 0.3126]]])
tensor([[[-0.1984, 2.5553, 1.5839],[-0.2058, 1.2268, -0.9894],[ 0.2426, -0.1919, -1.0239]],[[-0.4502, -2.3320, -0.1471],[-0.0087, 0.0856, 1.3771],[-0.5613, -2.6421, 0.3126]]])