本文将会讲到四种典型的深度学习框架:Tensorflow-GPU  keras pyTorch caffe 的配置和安装。我们的系统环境是Centos 7。一:先安装anaconda,因为anaconda较python来讲,其库更全,而且也便于支持其他语言。

(1) 下载个anaconda。地址:https://www.continuum.io/downloads 或者 https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ 。下载Anaconda3-5.1.0-Linux-x86_64.sh,注:本机为64位系统。

(2)上传Anaconda3-5.1.0-Linux-x86_64.sh至虚拟机centOS7的home目录下。

(3)输入命令:bash Anaconda3-5.1.0-Linux-x86_64.sh

(4)傻瓜式安装 直至成功,安装成功后使用,source ~/.bashrc 进行激活,命令行输入 python,看到如下图:

centos7 安装CUDA8 centos7安装cudnn_python

安装Anaconda 成功。

二:确定是否安装CUDA 和 cuDNN(想搞清楚这两个是什么的,可以看这个链接:【】

(1) 查看是否装好了CUDA,使用命令:cat /usr/local/cuda/version.txt,结果如下图:

centos7 安装CUDA8 centos7安装cudnn_centos7 安装CUDA8_02

(2)然后查看是否安装好了cuDNN,使用命令:cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

centos7 安装CUDA8 centos7安装cudnn_深度学习_03

(3)确定这两个存在,才能装 tensorflow-gpu,如果不存在,是要进行安装的,当然是需要管理员权限的。具体安装可以自行搜索。

三:安装tensorflow 

直接使用 pip install tensorflow-gpu 或者 pip install tensorflow-gpu==?(版本号)

这里要注意:安装完 Tensorflow 后运行时侯可能出现:tensorflow.python.framework.errors_impl.InternalError: cudaGetDevice() failed. Status: CUDA driver version is insufficient for CUDA runtime version

意思是CUDA驱动版本和CUDA运行版本冲突,主要是nvidia 驱动版本不对,可以使用 nvidia-smi 进行查看GPU 驱动版本,如下:

centos7 安装CUDA8 centos7安装cudnn_centos_04

则显示该驱动是 384.90,他是个CUDA 9.0版本对应的。

解决方法一:

    可以升级更换驱动等。具体解决可以看网上相关教程:https://www.jianshu.com/p/48016c73eec2

解决方法二:

     使用conda 进行安装低版本的 TF-GPU 这样就可以达到,原来我装的 1.13 但是出了问题换成了 1.10 就完美解决问题,因为TF 在安装时候,封装了 CUDA 和 cuDNN包-版本高的话,和驱动容易冲突,换了低版本就可以了。

四:安装keras

直接使用 pip install keras==?(版本号安装)

五:安装pyTorch

直接使用  python -m pip install --upgrade torch torchvision -i https://pypi.tuna.tsinghua.edu.cn/simple

六:安装caffe 

conda create -n caffe_gpu -c defaults python=2.7 caffe-gpu

前提需要网速可以,全部安装结束,然后 import caffe  发现没报错,不过在运行时候可能报错,目前还没运行caffe 代码,等到有问题持续更新

七:从第三步到第六步均可以使用conda进行安装

这里使用 tf 为例

(1)使用conda,重启conda,进行更新:conda update -n base conda

(2)创建一个框架环境,需要指定 Python版本:conda create -n tf pythoin=3.x (注:这里的3.x 不用精确到3.6.8的第三位,只用写 3.6就行)

(3)激活创建环境:conda activate tf 或 source activate tf

(4)进行conda安装: conda install tensorflow-gpu,然后进行傻瓜安装

(5)使用python命令进入python 编辑环境,进行测试:

centos7 安装CUDA8 centos7安装cudnn_深度学习_05

成功!

(6) 退出 conda 环境:source deactivate 或者 conda deactivate

(7)这里注意使用anaconda安装的环境,每次使用TF等框架,需要激活 conda activate tf 或者 source activate tf

(8)这里附上conda 安装和 pip 安装的不同