我这里主要参考了:

并根据自己在安装中遇到的情况做了一些改动。

 

先说明一下我的Ubuntu和GPU版本:

Ubuntu 16.04

GPU:GEFORCE GTX 1060

 

1. 查看显卡型号

使用命令:lspci | grep -i nvidia 查看电脑上的显卡,是否是nvidia版本。

2. 安装NVIDIA显卡驱动

具体做法参考之前博客的介绍。

3. 安装cuda 8

下载地址:https://developer.nvidia.com/compute/cuda/8.0/Prod2/local_installers/cuda_8.0.61_375.26_linux-run

下载下来之后是一个.sh文件,运行这个文件就开始安装了,后面会出现条款,全部同意即可。不过中间有一步,如果已经通过2自己安装过驱动了就不用安装了,如果没有就安装。

4. 设置cuda的环境变量

在~/.bashrc中的末尾添加:

export CUDA_HOME=/usr/local/cuda-8.0
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH
export PATH=/usr/local/cuda-8.0/bin:$PATH

然后source ~/.bashrc立即生效。

5. 检查和验证之前的操作是否正确

(1)使用命令:nvcc --version,查看nvcc版本;

(2)使用命令:nvidia-smi,查看驱动是否安装成功,这一步之前可能需要reboot一下使得刚装的驱动生效;

(3)运行一下官方的例子。进入到samples文件夹(在用户目录下或者/usr/local/cuda/samples下都有),进入1_Utilities/deviceQuery中,make 然后运行./deviceQuery,会输出一堆信息,如果最后是PASS,则说明之前都对。

6. 安装cudnn

官网下载地址:https://developer.nvidia.com/rdp/cudnn-download

我选择了cuDNN v5.1 Library for linux,下载之后使用命令:tar -xvf filename,解压即可。然后把lib和include拷贝到cuda目录:

sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64

然后修改拷过去的文件的访问权限:
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

然后命令行进入 cuda/lib64 路径下,运行以下命令:

sudo cp lib* /usr/local/cuda/lib64/ #复制动态链接库
cd /usr/local/cuda/lib64/sudo rm -rf libcudnn.so libcudnn.so.5 #删除原有动态文件
sudo ln -s libcudnn.so.5.1.10 libcudnn.so.5 #生成软衔接
sudo ln -s libcudnn.so.5 libcudnn.so #生成软链接

最后更新链接库:sudo Idconfig

到这里cuda和cudnn就安装完成了,下面开始anaconda和pytorch的安装

7. anaconda安装

下载地址:https://www.anaconda.com/download/

下载下来,是一个.sh文件,然后运行这个命令即可(运行命令./sh)。

设置虚拟环境:conda create -n env_name python=3.6.5以创建一个虚拟环境env_name。

使用命令:conda env_name,来激活虚拟环境

8. 安装pytorch

下载地址:https://pytorch.org/get-started/previous-versions/

我选择下载的是:https://download.pytorch.org/whl/cu80/torch-0.4.1-cp36-cp36m-linux_x86_64.whl

然后使用命令安装:pip install torch-0.4.1-cp36-cp36m-linux_x86_64.whl

再安装torchvision:pip install torchvision

9. 测试安装是否成功

import torch
import torchvision
如果没报错就说明安装成功了。