背景

显卡型号是 NVDIAGEFORCE GTX1050,NVDIA官网算力6.1,比起tensorflow-gpu最低要求3.1,够运行了

NVIDIA GPU 算力表 https://developer.nvidia.com/cuda-gpus

tensorflow与cuda对应关系_tensorflow

CUDA9.0安装:

CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。 开发人员现在可以使用C语言来为CUDA™架构编写程序,C语言是应用最广泛的一种高级编程语言。所编写出的程序于是就可以在支持CUDA™的处理器上以超高性能运行。


CUDA9.0下载:https://developer.nvidia.com/cuda-downloads

tensorflow与cuda对应关系_机器学习_02


下载界面我的电脑是window10,所以就选择如图所示的选项。主要的提一点,就是最后的Installer Type这个选项,exe(network)是在线安装版,也就是你执行这个安装程序,需要联网。exe(local)是离线安装版,不过他文件比较大。选完后,点击下面的download就行下载。

tensorflow与cuda对应关系_CUDA_03


exe(network)线安装版

tensorflow与cuda对应关系_tensorflow与cuda对应关系_04


exe(local)离线安装版下载完成后,双击运行文件

tensorflow与cuda对应关系_tensorflow_05


选择 ok等进度条走完,就会进入安装界面。

tensorflow与cuda对应关系_tensorflow与cuda对应关系_06


安装加载界面

tensorflow与cuda对应关系_tensorflow与cuda对应关系_07


检查系统兼容性,等一下就好

如果检测通过了,那么恭喜你,你的显卡可以安装cuda,如果没有通过,只能抱歉的告诉你,只能请你pip unistall tensorflow-gpu,然后执行pip install tensorflow。那你的电脑的显卡不支持tensorflow-gpu加速。

tensorflow与cuda对应关系_机器学习_08

点击 同意并继续

如果你不知道你要安装些什么,那么请你勾选,精简。如果

tensorflow与cuda对应关系_tensorflow_09


勾选精简,然后点击下一步

tensorflow与cuda对应关系_tensorflow_10


等待安装完成

tensorflow与cuda对应关系_CUDA_11


选择 下一步

tensorflow与cuda对应关系_tensorflow_12

全部勾选 ,点击关闭

下面这一步很重要:

设置环境变量:

安装结束后,我们在计算机上点右键,打开属性->高级系统设置->环境变量,可以看到系统中多了CUDA_PATH和CUDA_PATH_V9_0两个环境变量。

tensorflow与cuda对应关系_CUDA_13


我们还需要在环境变量中添加如下几个变量:CUDA_SDK_PATH = C:\ProgramData\NVIDIA Corporation\CUDA Samples\v9.0

CUDA_LIB_PATH = %CUDA_PATH%\lib\x64

CUDA_BIN_PATH = %CUDA_PATH%\bin

CUDA_SDK_BIN_PATH = %CUDA_SDK_PATH%\bin\win64

CUDA_SDK_LIB_PATH = %CUDA_SDK_PATH%\common\lib\x64

设置完成之后,我们可以打开cmd来查看。

tensorflow与cuda对应关系_tensorflow与cuda对应关系_14


下一步是监测cuda安装成功与否:在cuda安装文件夹中有deviceQuery.exe 和 bandwidthTest.exe两个程序。首先启动cmd DOS命令窗口,默认进来的是c:\users\Admistrator>路径,输入 cd … 两次,来到c:目录下输入dir 找到安装的cuda文件夹。

tensorflow与cuda对应关系_cuDNN_15

分别输入deviceQuery.exe 和 bandwidthTest.exe,运行结果如图所示。Rsult=PASS则说明通过,反之,Rsult=Fail 则需要重新安装。

tensorflow与cuda对应关系_tensorflow与cuda对应关系_16


tensorflow与cuda对应关系_tensorflow与cuda对应关系_17


cuDNN配置

解压压缩包cudnn-9.0-windows10-x64-v7.0.zip,得到三个文件夹

对于tensorflow而言,真正实现加速的是cudnn,然后cudnn调用的是cuda显卡驱动。所以最后我们要配置cudnn这个模块。

cuDNN的全称为NVIDIA CUDA® Deep Neural Network library,是NVIDIA专门针对深度神经网络(Deep Neural Networks)中的基础操作而设计基于GPU的加速库。cuDNN为深度神经网络中的标准流程提供了高度优化的实现方式,例如convolution、pooling、normalization以及activation layers的前向以及后向过程。

cuDNN只是NVIDIA深度神经网络软件开发包中的其中一种加速库。想了解NVIDIA深度神经网络加速库中的其他包请戳链接https://developer.nvidia.com/deep-learning-software。

下面我们说一下正确的安装cuDNN方式,其实跟着官方安装说明进行安装就可以了。

1.从https://developer.nvidia.com/cudnn上下载cudnn相应版本的压缩包(可能需要注册或登录)。

2.如果这个压缩包不是.tgz格式的,把这个压缩包重命名为.tgz格式。解压当前的.tgz格式的软件包到系统中的任意路径,解压后的文件夹名为cuda,文件夹中包含三个文件夹:一个为include,另一个为lib64,还有一个是bin,然后复制到CUDA_PATH下面。

3.将解压后的文件中的lib/x64文件夹关联到环境变量中。这一步很重要。(配置到环境变量的path全局变量里,详细过程这里就不演示了)

tensorflow与cuda对应关系_tensorflow_18


更详细的步骤见官网 https://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html#install-windows

tensorflow与cuda对应关系_tensorflow与cuda对应关系_19

Tensorflow-gpu和keras

可以直接pip install tensorflow-gpu
建议先升级pip,以防后面出现错误 python -m pip install --upgrade pip
或者通过anaconda集成安装

验证

运行tensorflow检验
#coding=utf-8
import tensorflow as tf
import numpy as np
hello=tf.constant(‘hhh’)
sess=tf.Session()
print (sess.run(hello))

如果运行,没有报错,就是表示可以放烟花了。我们可以愉快的开始tensorflow之旅了。