返回

Linux 服务器上安装 PyTorch:一步步详细指南

人工智能

PyTorch 是一个深受机器学习和人工智能爱好者喜爱的开源深度学习框架。它以其灵活性和易用性而闻名,使研究人员和从业者能够轻松地开发和部署复杂的神经网络模型。在 Linux 服务器上安装 PyTorch 是迈向 AI 探索之旅的关键一步,本文将详细介绍这一过程。

先决条件

在开始安装过程之前,确保您的服务器满足以下先决条件:

  • 支持的 Linux 发行版: Ubuntu 18.04 或更高版本、CentOS 7 或更高版本
  • NVIDIA GPU(推荐): 用于加速训练和推理
  • CUDA Toolkit: CUDA Toolkit 提供了运行 PyTorch 所需的基本库和驱动程序
  • cuDNN(建议): cuDNN 是一个深度神经网络库,可以显着提高 GPU 性能
  • Python 3.6 或更高版本: Python 是 PyTorch 的基础语言

安装步骤

1. 安装 NVIDIA 驱动程序

如果您使用的是 NVIDIA GPU,则需要先安装专有的 NVIDIA 驱动程序。有关具体说明,请参阅 NVIDIA 官方文档。

2. 安装 CUDA Toolkit

CUDA Toolkit 是一个用于开发、编译和运行 CUDA 应用程序的工具包。要安装 CUDA Toolkit,请按照以下步骤操作:

sudo dpkg -i cuda-repo-<version>_<arch>.deb
sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/<version>/<distro>/<arch>/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda

3. 安装 cuDNN

cuDNN 是一个深度神经网络库,可以显着提高 GPU 性能。要安装 cuDNN,请按照以下步骤操作:

sudo cp -r <cuDNN_folder>/* /usr/local/cuda/

4. 安装 PyTorch

要安装 PyTorch,请运行以下命令:

pip install torch torchvision torchtext --extra-index-url https://download.pytorch.org/whl/cu113

确保将 cu113 替换为您安装的 CUDA 版本。

5. 验证安装

要验证 PyTorch 是否成功安装,请运行以下命令:

python3
>>> import torch
>>> torch.cuda.is_available()

如果返回 True,则表明 PyTorch 已成功安装并在您的 GPU 上可用。

故障排除

1. “ModuleNotFoundError: No module named 'torch'”

如果出现此错误,请确保您已正确安装 PyTorch。您可以通过运行以下命令来检查:

pip list | grep torch

如果未找到 PyTorch,请重新安装它。

2. “ImportError: libcudnn.so.8: cannot open shared object file: No such file or directory”

如果出现此错误,请确保您已正确安装 cuDNN。您可以通过运行以下命令来检查:

ldconfig -p | grep libcudnn

如果找不到 libcudnn,请重新安装它。

结论

按照本指南中的步骤操作,您将能够在 Linux 服务器上成功安装 PyTorch。有了这个强大的框架,您可以开始探索 AI 世界的无限可能性。无论是开发新模型、训练现有模型,还是部署应用程序,PyTorch 为您提供了必要的工具来推动创新和解决当今最具挑战性的问题。