返回

离线安装支持容器的 CentOS 7 GPU 环境

人工智能

CentOS 7 离线安装支持容器的 GPU 环境:循序渐进指南

引言

对于无法连接互联网的生产环境,部署以容器方式在 GPU 机器上运行的 AI 应用程序可能是一项艰巨的任务,因为所需的软件安装复杂且依赖关系繁多。本指南将详细介绍在 CentOS 7 系统上离线安装支持容器的 GPU 环境的完整步骤,涵盖从操作系统准备到容器化环境设置的各个方面。

操作系统准备

1. 安装 CentOS 7 操作系统

使用官方 ISO 映像安装 CentOS 7 最小化版本。

2. 更新系统

运行以下命令更新系统软件包:

yum update -y

NVIDIA 驱动安装

1. 下载驱动

从 NVIDIA 网站下载与系统版本和 GPU 型号相对应的驱动程序。

2. 安装驱动

将驱动程序包复制到系统中,并运行以下命令进行安装:

yum localinstall /path/to/NVIDIA-driver-package.run

3. 重启系统

安装完成后,重新启动系统以加载新驱动程序。

Docker 安装

1. 添加 Docker 存储库

运行以下命令添加 Docker 存储库:

yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo

2. 安装 Docker

运行以下命令安装 Docker 引擎:

yum install docker-ce -y

3. 启动 Docker 服务

运行以下命令启动 Docker 服务:

systemctl start docker

4. 允许非 root 用户使用 Docker

运行以下命令允许非 root 用户使用 Docker:

usermod -aG docker ${USER}

5. 重启系统

重新启动系统以应用更改。

NVIDIA Container Toolkit 安装

1. 准备包

下载 NVIDIA Container Toolkit 包并解压缩:

wget https://github.com/NVIDIA/nvidia-docker/releases/download/v2.0.3/nvidia-container-toolkit-2.0.3.run
chmod +x  nvidia-container-toolkit-2.0.3.run

2. 安装 Toolkit

运行以下命令安装 NVIDIA Container Toolkit:

./nvidia-container-toolkit-2.0.3.run

3. 验证安装

运行以下命令验证安装:

docker run --rm --gpus all docker/whalesay cowsay Moo

安装 Container Runtime Interface (CRI)

1. 安装 CRI-O

CRI-O 是一个轻量级的容器运行时,它提供了与 Kubernetes 容器运行时接口 (CRI) 的标准化接口。

yum install cri-o -y

2. 启动 CRI-O

运行以下命令启动 CRI-O:

systemctl start crio

3. 允许 CRI-O 使用 Docker

运行以下命令允许 CRI-O 使用 Docker:

crictl config set runtime-endpoint docker

4. 重启 CRI-O

重新启动 CRI-O 以应用更改:

systemctl restart crio

使用 NVIDIA Container Toolkit 构建 Docker 镜像

1. 编写 Dockerfile

创建一个 Dockerfile 指定基础镜像并添加 NVIDIA Container Toolkit。

2. 构建镜像

运行以下命令构建 Docker 镜像:

docker build -t your-image-name .

部署应用程序

1. 运行容器

使用以下命令运行容器:

docker run -it --gpus all your-image-name

结论

通过按照本指南中的步骤,您将成功在 CentOS 7 系统上离线安装支持容器的 GPU 环境。此环境将允许您在 GPU 机器上以容器方式部署和运行 AI 应用程序,即使在无法连接互联网的情况下也是如此。