Linux 服务器上安装 PyTorch:一步步详细指南
2024-02-03 07:04:28
PyTorch 是一个深受机器学习和人工智能爱好者喜爱的开源深度学习框架。它以其灵活性和易用性而闻名,使研究人员和从业者能够轻松地开发和部署复杂的神经网络模型。在 Linux 服务器上安装 PyTorch 是迈向 AI 探索之旅的关键一步,本文将详细介绍这一过程。
先决条件
在开始安装过程之前,确保您的服务器满足以下先决条件:
- 支持的 Linux 发行版: Ubuntu 18.04 或更高版本、CentOS 7 或更高版本
- NVIDIA GPU(推荐): 用于加速训练和推理
- CUDA Toolkit: CUDA Toolkit 提供了运行 PyTorch 所需的基本库和驱动程序
- cuDNN(建议): cuDNN 是一个深度神经网络库,可以显着提高 GPU 性能
- Python 3.6 或更高版本: Python 是 PyTorch 的基础语言
安装步骤
1. 安装 NVIDIA 驱动程序
如果您使用的是 NVIDIA GPU,则需要先安装专有的 NVIDIA 驱动程序。有关具体说明,请参阅 NVIDIA 官方文档。
2. 安装 CUDA Toolkit
CUDA Toolkit 是一个用于开发、编译和运行 CUDA 应用程序的工具包。要安装 CUDA Toolkit,请按照以下步骤操作:
- 从 NVIDIA 网站下载 CUDA Toolkit:https://developer.nvidia.com/cuda-toolkit-archive
- 运行以下命令安装 CUDA Toolkit:
sudo dpkg -i cuda-repo-<version>_<arch>.deb
sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/<version>/<distro>/<arch>/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda
3. 安装 cuDNN
cuDNN 是一个深度神经网络库,可以显着提高 GPU 性能。要安装 cuDNN,请按照以下步骤操作:
- 从 NVIDIA 网站下载 cuDNN:https://developer.nvidia.com/cudnn
- 解压缩下载的存档
- 将解压缩的文件夹中的文件复制到
/usr/local/cuda/
目录:
sudo cp -r <cuDNN_folder>/* /usr/local/cuda/
4. 安装 PyTorch
要安装 PyTorch,请运行以下命令:
pip install torch torchvision torchtext --extra-index-url https://download.pytorch.org/whl/cu113
确保将 cu113
替换为您安装的 CUDA 版本。
5. 验证安装
要验证 PyTorch 是否成功安装,请运行以下命令:
python3
>>> import torch
>>> torch.cuda.is_available()
如果返回 True
,则表明 PyTorch 已成功安装并在您的 GPU 上可用。
故障排除
1. “ModuleNotFoundError: No module named 'torch'”
如果出现此错误,请确保您已正确安装 PyTorch。您可以通过运行以下命令来检查:
pip list | grep torch
如果未找到 PyTorch,请重新安装它。
2. “ImportError: libcudnn.so.8: cannot open shared object file: No such file or directory”
如果出现此错误,请确保您已正确安装 cuDNN。您可以通过运行以下命令来检查:
ldconfig -p | grep libcudnn
如果找不到 libcudnn,请重新安装它。
结论
按照本指南中的步骤操作,您将能够在 Linux 服务器上成功安装 PyTorch。有了这个强大的框架,您可以开始探索 AI 世界的无限可能性。无论是开发新模型、训练现有模型,还是部署应用程序,PyTorch 为您提供了必要的工具来推动创新和解决当今最具挑战性的问题。