深入浅出动手学深度学习5.1：探索 PyTorch 中的层与块

人工智能

2024-02-07 12:37:09

利用 PyTorch 中的层和块踏入深度学习的浩瀚领域

踏入深度学习的领域，就像踏入一个浩瀚的海洋。在 PyTorch 的指引下，我们将踏上构建神经网络的旅程，探索其核心构建模块——层与块。

层：神经网络的基本组成单位

层是 PyTorch 中神经网络的基本元素，负责执行特定操作，如数据处理、特征提取和关系建模。丰富的层类型赋予了 PyTorch 无与伦比的灵活性，包括：

线性层： 执行线性变换，应用于特征提取和分类。
卷积层： 处理网格状数据，如图像，用于提取空间特征。
池化层： 缩小输入张量的尺寸，降低计算成本。
激活函数层： 引入非线性，使模型能够学习复杂的关系。

块：层的抽象封装

块是层的抽象封装，针对特定任务组合多个层。PyTorch 提供了预定义的块，包括：

顺序块： 按顺序排列层，形成神经网络的主干。
并行块： 并行排列层，提升计算效率。
条件块： 根据条件选择执行不同的路径，实现网络的可变性。

层与块的协作构建

通过将层与块结合，我们可以构建出复杂的深度学习架构。例如，一个常见的 CNN 架构包含以下组件：

卷积块： 提取图像特征。
池化块： 降低特征图尺寸。
线性块： 将特征映射到输出空间。

动手实践：搭建图像分类神经网络

为了加深对层与块的理解，让我们动手搭建一个图像分类神经网络：

import torch
import torch.nn as nn

# 定义卷积块
class ConvBlock(nn.Module):
    def __init__(self, in_channels, out_channels, kernel_size=3, stride=1, padding=1):
        super(ConvBlock, self).__init__()
        self.conv = nn.Conv2d(in_channels, out_channels, kernel_size, stride, padding)
        self.bn = nn.BatchNorm2d(out_channels)
        self.relu = nn.ReLU()

    def forward(self, x):
        x = self.conv(x)
        x = self.bn(x)
        x = self.relu(x)
        return x

# 定义顺序块
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = ConvBlock(3, 64)
        self.conv2 = ConvBlock(64, 128)
        self.fc = nn.Linear(128 * 7 * 7, 10)

    def forward(self, x):
        x = self.conv1(x)
        x = self.conv2(x)
        x = x.view(x.size(0), -1)
        x = self.fc(x)
        return x

# 实例化神经网络
net = Net()

# 定义优化器和损失函数
optimizer = torch.optim.Adam(net.parameters(), lr=0.001)
loss_fn = nn.CrossEntropyLoss()

# 训练网络
# ... 训练代码

# 评估网络
# ... 评估代码