(1) 下载个anaconda。地址:https://www.continuum.io/downloads 或者 https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ 。下载Anaconda3-5.1.0-Linux-x86_64.sh,注:本机为64位系统。
(2)上传Anaconda3-5.1.0-Linux-x86_64.sh至虚拟机centOS7的home目录下。
(3)输入命令:bash Anaconda3-5.1.0-Linux-x86_64.sh
(4)傻瓜式安装 直至成功,安装成功后使用,source ~/.bashrc 进行激活,命令行输入 python,看到如下图:
安装Anaconda 成功。
(1) 查看是否装好了CUDA,使用命令:cat /usr/local/cuda/version.txt,结果如下图:
(2)然后查看是否安装好了cuDNN,使用命令:cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
(3)确定这两个存在,才能装 tensorflow-gpu,如果不存在,是要进行安装的,当然是需要管理员权限的。具体安装可以自行搜索。
直接使用 pip install tensorflow-gpu 或者 pip install tensorflow-gpu==?(版本号)
这里要注意:安装完 Tensorflow 后运行时侯可能出现:tensorflow.python.framework.errors_impl.InternalError: cudaGetDevice() failed. Status: CUDA driver version is insufficient for CUDA runtime version
意思是CUDA驱动版本和CUDA运行版本冲突,主要是nvidia 驱动版本不对,可以使用 nvidia-smi 进行查看GPU 驱动版本,如下:
则显示该驱动是 384.90,他是个CUDA 9.0版本对应的。
解决方法一:
可以升级更换驱动等。具体解决可以看网上相关教程:https://www.jianshu.com/p/48016c73eec2
解决方法二:
使用conda 进行安装低版本的 TF-GPU 这样就可以达到,原来我装的 1.13 但是出了问题换成了 1.10 就完美解决问题,因为TF 在安装时候,封装了 CUDA 和 cuDNN包-版本高的话,和驱动容易冲突,换了低版本就可以了。
直接使用 pip install keras==?(版本号安装)
直接使用 python -m pip install --upgrade torch torchvision -i https://pypi.tuna.tsinghua.edu.cn/simple
conda create -n caffe_gpu -c defaults python=2.7 caffe-gpu
前提需要网速可以,全部安装结束,然后 import caffe 发现没报错,不过在运行时候可能报错,目前还没运行caffe 代码,等到有问题持续更新
这里使用 tf 为例
(1)使用conda,重启conda,进行更新:conda update -n base conda
(2)创建一个框架环境,需要指定 Python版本:conda create -n tf pythoin=3.x (注:这里的3.x 不用精确到3.6.8的第三位,只用写 3.6就行)
(3)激活创建环境:conda activate tf 或 source activate tf
(4)进行conda安装: conda install tensorflow-gpu,然后进行傻瓜安装
(5)使用python命令进入python 编辑环境,进行测试:
成功!
(6) 退出 conda 环境:source deactivate 或者 conda deactivate
(7)这里注意使用anaconda安装的环境,每次使用TF等框架,需要激活 conda activate tf 或者 source activate tf
(8)这里附上conda 安装和 pip 安装的不同