对 MXNet 逐梦之旅的透彻剖析：在 CPU 与 GPU 上使用 MXNetFashionMNIST 数据集进行 CNN 分类

2023-12-23 10:08:49

在深度学习领域，了解不同硬件架构对模型训练和推理的影响至关重要。MXNet 逐梦之旅的练习五提供了一个绝佳的机会，让我们探索使用 MXNetFashionMNIST 数据集在 CPU 和 GPU 上进行卷积神经网络 (CNN) 分类之间的差异。

本文将深入探讨：

MXNetFashionMNIST 数据集的概述
使用 MXNet 构建 CNN 模型
在 CPU 和 GPU 上评估模型性能

MXNetFashionMNIST 数据集

MXNetFashionMNIST 数据集是一个由 70,000 张图像组成的集合，这些图像属于 10 种不同的时尚类别（例如，T 恤、鞋子、包）。数据集分为训练集（60,000 张图像）和测试集（10,000 张图像）。

使用 MXNet 构建 CNN 模型

为了对 MXNetFashionMNIST 数据集进行分类，我们将构建一个 CNN 模型，该模型包括卷积层、池化层和全连接层。代码如下所示：

# 使用 `gluon.nn` 模块构建 CNN 模型
model = nn.Sequential()
model.add(nn.Conv2D(64, kernel_size=5),
        nn.BatchNorm(),
        nn.Activation('relu'),
        nn.MaxPool2D(pool_size=2, strides=2),
        nn.Conv2D(128, kernel_size=3),
        nn.BatchNorm(),
        nn.Activation('relu'),
        nn.MaxPool2D(pool_size=2, strides=2),
        nn.Flatten(),
        nn.Dense(512),
        nn.Activation('relu'),
        nn.Dense(10))

在 CPU 和 GPU 上评估模型性能

为了评估模型性能，我们将分别在 CPU 和 GPU 上训练和评估模型。我们将使用以下指标来评估模型：

训练精度
验证精度
训练时间
推理时间

我们使用的数据准备和模型训练脚本如下：

# 数据准备
data = mx.image.FashionMNIST(train=True,
                           test=True)
data_train = data.train.transform_first(
    mx.image.CropAug(45).to_ndarray())
data_test = data.test.transform_first(
    mx.image.CropAug(45).to_ndarray())

# 使用 CPU 和 GPU 分别训练模型
cpu_ctx = mx.cpu()
gpu_ctx = mx.gpu()

cpu_trainer = gluon.Trainer(model.collect_params(), 'sgd', {'learning_rate': 0.01})
gpu_trainer = gluon.Trainer(model.collect_params(), 'sgd', {'learning_rate': 0.01})

cpu_epochs = 10
gpu_epochs = 5

cpu_train_data = gluon.data.DataLoader(data_train, 64, shuffle=True)
gpu_train_data = gluon.data.DataLoader(data_train, 64, shuffle=True)

cpu_test_data = gluon.data.DataLoader(data_test, 1000)
gpu_test_data = gluon.data.DataLoader(data_test, 1000)

for epoch in range(cpu_epochs):
    cpu_train_accuracy, cpu_train_loss = fit(cpu_trainer, cpu_train_data, cpu_test_data)

for epoch in range(gpu_epochs):
    gpu_train_accuracy, gpu_train_loss = fit(gpu_trainer, gpu_train_data, gpu_test_data)