Keras 深度学习实战：使用 CNN 分类 Fashion MNIST 数据集

2023-12-17 16:00:07

使用卷积神经网络在 Fashion MNIST 数据集上进行图像分类

了解卷积神经网络 (CNN)

当我们谈论图像分类时，卷积神经网络 (CNN) 是首选的架构。与全连接神经网络不同，CNN 专门针对图像数据进行了设计，因为它们能够提取图像中的空间特征。CNN 由一系列卷积层组成，每个卷积层使用称为卷积核的可学习滤波器在图像上滑动。这些卷积核检测图像中特定模式，如边缘、形状和纹理，从而提取关键特征。

探索 Fashion MNIST 数据集

Fashion MNIST 是一个流行的图像数据集，包含 70,000 张灰度图像，划分为 10 个类别，包括 T 恤、裤子、鞋子等。这个数据集非常适合评估图像分类算法的性能，因为它提供了具有挑战性的图像识别任务。

构建 CNN 模型

我们使用 Keras 构建了一个 CNN 模型，该模型包含以下层：

卷积层： 使用 3x3 卷积核提取图像特征。
池化层： 通过减少特征图的空间尺寸来减少计算量。
展平层： 将多维特征图转换为一维向量。
全连接层： 执行分类任务。

训练和评估模型

使用 Fashion MNIST 数据集训练我们的 CNN 模型涉及以下步骤：

加载和预处理数据： 加载数据并将其标准化为 0 到 1 之间的范围。
定义和编译模型： 使用 Keras 构建和编译我们的 CNN 模型。
训练模型： 使用训练数据训练模型，并使用验证集监控其性能。
评估模型： 使用测试集评估训练后的模型的准确性。

结果和代码示例

经过训练，我们的 CNN 模型在 Fashion MNIST 数据集上获得了 92% 的分类准确率。以下是实现该模型的 Python 代码示例：

import tensorflow as tf
from keras.datasets import fashion_mnist
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D, Flatten, Dense

# 加载数据
(x_train, y_train), (x_test, y_test) = fashion_mnist.load_data()

# 预处理
x_train = x_train.astype('float32') / 255
x_test = x_test.astype('float32') / 255

# 定义网络
model = Sequential([
    Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    MaxPooling2D((2, 2)),
    Conv2D(64, (3, 3), activation='relu'),
    MaxPooling2D((2, 2)),
    Flatten(),
    Dense(128, activation='relu'),
    Dense(10, activation='softmax')
])

# 编译模型
model.compile(loss='sparse_categorical_crossentropy',
              optimizer='adam',
              metrics=['accuracy'])

# 训练模型
model.fit(x_train, y_train, epochs=10, validation_data=(x_test, y_test))

# 评估模型
score = model.evaluate(x_test, y_test)
print('测试准确率：', score[1])