注意: 本文是在电脑上已经安装好docker环境的前提下进行的。
docker环境如何安装参照前文。
安装NVIDIA-Docker
# Add the package repositories
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \
sudo apt-key add -
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \
sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo apt-get update
正式安装NVIDIA-Docker:
# Install nvidia-docker2 and reload the Docker daemon configuration
sudo apt-get install -y nvidia-docker2
sudo pkill -SIGHUP dockerd
用最新的CUDA镜像来测试一下nvidia-smi(检查是否安装成功,安装成功,则会显示关于GPU的信息)。
# Test nvidia-smi with the latest official CUDA image
docker run --runtime=nvidia --rm nvidia/cuda:9.0-base nvidia-smi
如下图所示:
三、用Docker(NVIDIA-Docker)载入TensorFlow镜像
参考Dockerhub关于Tensorflow的页面(链接),主要是“Running Containers”部分。例如,如果要开启一个基于Python2、CPU版的TensorFlow,可以使用:
docker run -it --rm tensorflow/tensorflow bash
或者,开启一个基于Python3、GPU版的TensorFlow(可根据需要的版本指定镜像),并开启容器。注意,这里我们使用的Tag是1.10.0-gpu-py3。因为CUDA的版本是9.0,太高版本的TensorFlow不支持。更多的可选Tag可以查阅链接。
docker run -it --rm --runtime=nvidia tensorflow/tensorflow:1.10.0-gpu-py3 python
来看一下执行的结果。