背景
显卡型号是 NVDIAGEFORCE GTX1050,NVDIA官网算力6.1,比起tensorflow-gpu最低要求3.1,够运行了
NVIDIA GPU 算力表 https://developer.nvidia.com/cuda-gpus
CUDA9.0安装:
CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。 开发人员现在可以使用C语言来为CUDA™架构编写程序,C语言是应用最广泛的一种高级编程语言。所编写出的程序于是就可以在支持CUDA™的处理器上以超高性能运行。
CUDA9.0下载:https://developer.nvidia.com/cuda-downloads
下载界面我的电脑是window10,所以就选择如图所示的选项。主要的提一点,就是最后的Installer Type这个选项,exe(network)是在线安装版,也就是你执行这个安装程序,需要联网。exe(local)是离线安装版,不过他文件比较大。选完后,点击下面的download就行下载。
exe(network)线安装版
exe(local)离线安装版下载完成后,双击运行文件
选择 ok等进度条走完,就会进入安装界面。
安装加载界面
检查系统兼容性,等一下就好
如果检测通过了,那么恭喜你,你的显卡可以安装cuda,如果没有通过,只能抱歉的告诉你,只能请你pip unistall tensorflow-gpu,然后执行pip install tensorflow。那你的电脑的显卡不支持tensorflow-gpu加速。
点击 同意并继续
如果你不知道你要安装些什么,那么请你勾选,精简。如果
勾选精简,然后点击下一步
等待安装完成
选择 下一步
全部勾选 ,点击关闭
下面这一步很重要:
设置环境变量:
安装结束后,我们在计算机上点右键,打开属性->高级系统设置->环境变量,可以看到系统中多了CUDA_PATH和CUDA_PATH_V9_0两个环境变量。
我们还需要在环境变量中添加如下几个变量:CUDA_SDK_PATH = C:\ProgramData\NVIDIA Corporation\CUDA Samples\v9.0
CUDA_LIB_PATH = %CUDA_PATH%\lib\x64
CUDA_BIN_PATH = %CUDA_PATH%\bin
CUDA_SDK_BIN_PATH = %CUDA_SDK_PATH%\bin\win64
CUDA_SDK_LIB_PATH = %CUDA_SDK_PATH%\common\lib\x64
设置完成之后,我们可以打开cmd来查看。
下一步是监测cuda安装成功与否:在cuda安装文件夹中有deviceQuery.exe 和 bandwidthTest.exe两个程序。首先启动cmd DOS命令窗口,默认进来的是c:\users\Admistrator>路径,输入 cd … 两次,来到c:目录下输入dir 找到安装的cuda文件夹。
分别输入deviceQuery.exe 和 bandwidthTest.exe,运行结果如图所示。Rsult=PASS则说明通过,反之,Rsult=Fail 则需要重新安装。
cuDNN配置
解压压缩包cudnn-9.0-windows10-x64-v7.0.zip,得到三个文件夹
对于tensorflow而言,真正实现加速的是cudnn,然后cudnn调用的是cuda显卡驱动。所以最后我们要配置cudnn这个模块。
cuDNN的全称为NVIDIA CUDA® Deep Neural Network library,是NVIDIA专门针对深度神经网络(Deep Neural Networks)中的基础操作而设计基于GPU的加速库。cuDNN为深度神经网络中的标准流程提供了高度优化的实现方式,例如convolution、pooling、normalization以及activation layers的前向以及后向过程。
cuDNN只是NVIDIA深度神经网络软件开发包中的其中一种加速库。想了解NVIDIA深度神经网络加速库中的其他包请戳链接https://developer.nvidia.com/deep-learning-software。
下面我们说一下正确的安装cuDNN方式,其实跟着官方安装说明进行安装就可以了。
1.从https://developer.nvidia.com/cudnn上下载cudnn相应版本的压缩包(可能需要注册或登录)。
2.如果这个压缩包不是.tgz格式的,把这个压缩包重命名为.tgz格式。解压当前的.tgz格式的软件包到系统中的任意路径,解压后的文件夹名为cuda,文件夹中包含三个文件夹:一个为include,另一个为lib64,还有一个是bin,然后复制到CUDA_PATH下面。
3.将解压后的文件中的lib/x64文件夹关联到环境变量中。这一步很重要。(配置到环境变量的path全局变量里,详细过程这里就不演示了)
更详细的步骤见官网 https://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html#install-windows
Tensorflow-gpu和keras
可以直接pip install tensorflow-gpu
建议先升级pip,以防后面出现错误 python -m pip install --upgrade pip
或者通过anaconda集成安装
验证
运行tensorflow检验
#coding=utf-8
import tensorflow as tf
import numpy as np
hello=tf.constant(‘hhh’)
sess=tf.Session()
print (sess.run(hello))
如果运行,没有报错,就是表示可以放烟花了。我们可以愉快的开始tensorflow之旅了。