今天在阿里云上申请了一个深度学习服务器,碰到了很多坑,在网上查了好多资料,大都是自己电脑可以别的电脑就不可以的那种,整合了多个博客的文章才把环境配置好,现在写一个完整的配置方案,以后用起来就方便多了,也供大家参考。

一、首先安装nvidia驱动:

***在官网上查找符合自己gpu的驱动:http://www.nvidia.com/Download/index.aspx,选择合适的版本下载。
更新系统源:
sudo apt-get update
sudo apt-get upgrade

输入以下命令:
lsmod | grep nouveau,如果有东西出来,就表示有原来的驱动,需要进行禁止。

如果有旧的驱动,就删除旧的驱动,没有略过一下命令,直接安装驱动:
sudo apt-get purge nvidia*

执行以下命令创建一个文件
sudo vim/etc/modprobe.d/blacklist-nouveau.conf
并添加如下内容:
blacklist nouveau
options nouveau modeset=0

然后保存文件退出,执行下面命令更新一下
sudo update-initramfs -u

然后重启电脑,重启后打开终端再次输入命令
lsmod | grep nouveau
如果发现什么都没显示,那么说明禁用nouveau 成功了,然后开始安装NVIDIA驱动

即:sh NVIDIA-Linux-x86_64-390.42.run
安装完成后更新系统,source ~/.bashrc(千万记得)
测试一下,输入nvidia-smi则能得到gpu的基本信息。***

二、安装CUDA

在官网下载cuda文件,一定要是.run文件(runfile)。下载完成后直接进行安装sh cuda_9.0.176_384.81_linux.run

终端指定gpu linux指定gpu_深度学习


**第一行问你是否接受协议,输入accept

第二行问你是否安装驱动,上一步安装了驱动,这步输入n

以下的东西全是y、默认输入即可。

接下来再添加下环境变量

sudo vim ~/.bashrc
 export PATH=/usr/local/cuda-8.0/binKaTeX parse error: Expected '}', got 'EOF' at end of input: {PATH:+:{PATH}}
 export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64KaTeX parse error: Expected '}', got 'EOF' at end of input: …LIBRARY_PATH:+:{LD_LIBRARY_PATH}}
 export CUDA_HOME=/usr/local/cuda

然后执行以下命令,使链接立即生效
sudo ldconfig或者source ~/.bashrc

安装好cuda后,可以输入nvcc -version来查看是否成功安装。**

三、安装CUDNN

这部分真的是个坑,需要版本号对应。
cuda9.0-cudnn7.0以上版本(必须的)-tensorflow-gpu>=1.5.0版本
cuda8.0-cudnn6.0以下版本-tensorflow-gpu<=1.4.0版本,大家千万记住版本对应。

在官方网站下载cudnn:https://developer.nvidia.com/rdp/cudnn-archive

然后:

tar -zxvf cudnn-9.0-linux-x64-v7.tgz
 cd cuda
 sudo cp lib64/lib* /usr/local/cuda/lib64/
 sudo cp include/cudnn.h /usr/local/cuda/include/

更新链接:

cd /usr/local/cuda/lib64/
 sudo chmod +r libcudnn.so.7.0.5 //自己查看.so的版本 对应更改
 sudo ln -sf libcudnn.so.7.0.5 libcudnn.so.7
 sudo ln -sf libcudnn.so.7 libcudnn.so
 sudo ldconfig

到此,深度学习的基本配置就完成了。

四、安装tensorflowGPU版

通过使用以下命令来安装anaconda:
wget https://repo.continuum.io/archive/Anaconda3-5.0.1-Linux-x86_64.sh

然后运行:
sh Anaconda3-5.0.1-Linux-x86_64.sh
一路yes下来即可,最后的vs安装,若有需求便安装,记得加入环境变量。
然后更新系统环境:source ~/.bashrc
在anaconda中,默认python版本为3.6,且有pip安装工具。
执行以下命令:pip install tensorflow-gpu==1.5.0
完成tensorflow安装。
进入python运行界面,执行以下命令:
import tensorflow as tf
tf.test.is_gpu_available()
若最后出现true,那么恭喜到此为止,tensorflow深度学习gpu版就安装完成了。

(1)、如果您在阅读博客时遇到问题或者不理解的地方,可以联系我,互相交流、互相进步;

(2)、本人业余时间可以承接毕业设计和各种小项目,如系统构建、成立网站、数据挖掘、机器学习、深度学习等