全面剖析PyTorch：初学者的入门指南

人工智能

2023-12-09 22:18:45

PyTorch：深度学习入门指南

张量：数据容器

在 PyTorch 中，张量是表示多维数据的核心数据结构。它类似于 NumPy 中的 ndarray，可以存储标量、向量、矩阵等各种类型的数据。张量提供了高效的存储和处理数据的方法，为构建和训练深度学习模型奠定了基础。

自动微分：训练神经网络的利器

PyTorch 的一个关键特性是自动微分，它可以自动计算计算图中各个节点的梯度。这使得神经网络的训练变得更加轻松，因为你不必手动计算复杂的梯度，从而简化了训练过程并提高了效率。

实战演练：图像分类

为了加深理解，我们通过训练一个图像分类神经网络来深入了解 PyTorch 的工作原理。我们将使用 MNIST 数据集，其中包含 70,000 张手写数字图像。

步骤 1：导入库

import torch
import torchvision

步骤 2：加载和预处理数据

trainset = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=torchvision.transforms.ToTensor())
trainloader = torch.utils.data.DataLoader(trainset, batch_size=64, shuffle=True)

步骤 3：定义网络架构

class Net(torch.nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.fc1 = torch.nn.Linear(28 * 28, 128)
        self.fc2 = torch.nn.Linear(128, 10)

    def forward(self, x):
        x = x.view(x.size(0), -1)
        x = F.relu(self.fc1(x))
        x = self.fc2(x)
        return x

步骤 4：定义损失函数和优化器

criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(net.parameters(), lr=0.01, momentum=0.5)

步骤 5：训练网络

for epoch in range(20):  # 训练 20 个 epoch

    running_loss = 0.0
    for i, data in enumerate(trainloader, 0):

        # 获取输入数据
        inputs, labels = data

        # 梯度清零
        optimizer.zero_grad()

        # 前向传播
        outputs = net(inputs)

        # 计算损失
        loss = criterion(outputs, labels)

        # 反向传播
        loss.backward()

        # 更新权重
        optimizer.step()

        # 打印损失
        running_loss += loss.item()
        if i % 2000 == 1999:    # 每 2000 个批次打印一次损失
            print('[%d, %5d] loss: %.3f' %
                  (epoch + 1, i + 1, running_loss / 2000))
            running_loss = 0.0