PyTorch 中保存和加载模型的两种方式

2024-02-16 12:58:02

PyTorch 中保存和加载模型的双重奏

在 PyTorch 的深度学习王国中，保存和加载模型是至关重要的技巧，可以让你将训练有素的模型封存起来，以便将来恢复或部署。就好像将知识的宝藏锁在宝箱中，然后在需要时轻松开启一样。在这场探险中，我们将深入探索 PyTorch 为保存和加载模型提供的两种方法：序列化模型对象和分离模型权重。准备好沉浸在模型管理的魅力中了吗？

方法一：序列化模型对象

想象一下你的模型是一个精巧的乐高拼搭，包含所有必要的模块和连接。要保存它，你可以使用 torch.save 函数，它将整个模型对象及其状态捕捉到一个文件中。这个文件就像一张快照，记录了模型在特定时刻的精确状态。

torch.save(model_object, 'model.pt')  # 将整个模型对象保存为 "model.pt" 文件

当你想重新召唤你的模型时，torch.load 函数就像一个时间机器，可以将它从快照中复原。

model = torch.load('model.pt')  # 从 "model.pt" 文件中加载模型对象

方法二：分离模型权重

有时候，你可能只想保存模型的权重，而不是整个模型对象。权重就像乐高积木，定义了模型的行为。将它们与模型的其他部分分离，可以节省存储空间，并方便在不同模型之间共享权重。

torch.save(model_object.state_dict(), 'weights.pt')  # 将模型权重保存为 "weights.pt" 文件

要加载权重，你需要创建一个新模型对象，然后使用 load_state_dict 函数将权重注入其中。

model = MyModel()  # 创建一个新模型对象
model.load_state_dict(torch.load('weights.pt'))  # 加载模型权重

比较和对比

那么，这两种方法有什么区别呢？让我们来比较一下：

特征	序列化模型对象	分离模型权重
保存内容	整个模型对象	仅模型权重
文件大小	更大	更小
优点	易于使用，不需要创建新模型	节省存储空间，便于共享权重
缺点	文件较大，不适用于共享权重	需要创建新模型对象

使用案例

序列化模型对象： 当你需要保存整个模型对象，包括其架构和状态时，使用此方法。例如，在训练期间保存模型的检查点，以便在训练中断时恢复。
分离模型权重： 当你只想保存模型的权重，以便在不同模型之间共享或节省存储空间时，使用此方法。例如，在微调预训练模型时，你可以加载预训练权重并训练自己的模型。