步骤

  • 一、查个人电脑型号
  • 二、查版本是否支持
  • 三、下载安装并配置
  • 1.安装cuda
  • 2.安装cuDNN
  • 3.安装tensorflow-gpu
  • 4.其他
  • ①出错:找不到指定的模块
  • ②如果想让电脑用CPU运算
  • ③Windows查看GPU使用情况


一、查个人电脑型号

  • 点击【此电脑】——【管理】——【设备管理器】
  • 查看【显示适配器】的第二个

二、查版本是否支持

  • 网页搜索【型号+SPECIFICATION】,进入GeForce官网
  • 看到支持,你就放心了

三、下载安装并配置

  • 找到需要的Tensorflow型号和环境 ,点击→Tensorflow官网
  • 同时给出下图

1.安装cuda

  • 根据上图选择合适版本
  • 点击【控制面板】——【NVIDIA控制面板】——【左下角系统信息】——【组件】
  • 进入 cuda官网 选择并下载你合适的版本
  • 默认位置安装exe文件
  • 选择【自定义】安装
  • 只需选择CUDA下面这4项就够了(默认是全选的),当然你也可以默认
  • 检查,打开Anaconda Prompt
nvcc -V

tensorflow怎么确认训练是在用GPU 检查tensorflow gpu安装_python

  • 表明成功!

2.安装cuDNN

  • 选择合适版本
  • 进入 cuDNN官网 选择并下载你合适的版本
  • tensorflow怎么确认训练是在用GPU 检查tensorflow gpu安装_CUDA_02

  • 官网需要注册才能下载,这个无关紧要,注册以后下载就好
  • 把下载后的压缩文件解压缩,分别将cuda/include、cuda/lib、cuda/bin三个目录中的内容拷贝到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0(随版本定)对应的include、lib、bin目录下即可
  • 设置环境变量
    右击【计算机】,打开【属性】——【高级系统设置】——【环境变量】
  • tensorflow怎么确认训练是在用GPU 检查tensorflow gpu安装_tensorflow_03

  • 可以看到,系统中已经增加CUDA_PATH和CUDA_PATH_V8_0两个系统变量

继续添加:
①CUDA_SDK_PATH = C:\ProgramData\NVIDIA Corporation\CUDA Samples\v9.0
②CUDA_LIB_PATH = %CUDA_PATH%\lib\x64
③CUDA_BIN_PATH = %CUDA_PATH%\bin
④CUDA_SDK_BIN_PATH = %CUDA_SDK_PATH%\bin\win64
⑤CUDA_SDK_LIB_PATH = %CUDA_SDK_PATH%\common\lib\x64

在系统变量 PATH 添加:
%CUDA_LIB_PATH%;%CUDA_BIN_PATH%;%CUDA_SDK_LIB_PATH%;%CUDA_SDK_BIN_PATH%;
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\lib\x64;
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\bin;
C:\ProgramData\NVIDIA Corporation\CUDA Samples\v9.0\common\lib\x64;
C:\ProgramData\NVIDIA Corporation\CUDA Samples\v9.0\bin\win64;
如果你设置的自定义路径,上述路径要相应替换为你的自定义路径

tensorflow怎么确认训练是在用GPU 检查tensorflow gpu安装_CUDA_04


tensorflow怎么确认训练是在用GPU 检查tensorflow gpu安装_python_05

  • 使用cuda内置的deviceQuery.exe 和 bandwithTest.exe检查
  • 打开Anaconda Prompt
cd C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\extras\demo_suite
bandwidthTest.exe
deviceQuery.exe

tensorflow怎么确认训练是在用GPU 检查tensorflow gpu安装_tensorflow_06


tensorflow怎么确认训练是在用GPU 检查tensorflow gpu安装_tensorflow_07

  • 执行完,两次都返回Result=PASS,那么就成功了!!!

3.安装tensorflow-gpu

  • 最快方法是利用镜像,下载合适版本的tensorflow-gpu的whl文件,打开Anaconda Prompt(对于cuda=9.0,cuDNN=7.0,选择tensorflow-gpu=1.12
pip install tensorflow_gpu-1.12.0-cp35-cp35m-win_amd64.whl
  • 安装成功后,利用下面代码检查
import tensorflow as tf
# Creates a graph.
a = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[2, 3], name='a')
b = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[3, 2], name='b')
c = tf.matmul(a, b)
# Creates a session with log_device_placement set to True.
sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))
# Runs the op.
print(sess.run(c))

tensorflow怎么确认训练是在用GPU 检查tensorflow gpu安装_深度学习_08

  • 出现上图中

device:GPU:0

  • 表明该运算用到了GPU,即安装成功

4.其他

①出错:找不到指定的模块

ImportError: DLL load failed: 找不到指定的模块

  • 最有可能的就是tensorflow和cuDNN版本不一致,就需要卸载重安装
  • 如何卸载,看一篇网友写的:windows如何卸载
②如果想让电脑用CPU运算
③Windows查看GPU使用情况
cd C:\Program Files\NVIDIA Corporation\NVSMI
nvidia-smi
  • 如果没有NVSMI文件怎么办
  • 下载并解压至:C:\Program Files\NVIDIA Corporation,即可

百度网盘:https://pan.baidu.com/s/1glLHQc-lY4PFxxi3rFdkCg 提取码: 4hqa

tensorflow怎么确认训练是在用GPU 检查tensorflow gpu安装_cuda_09

  • 解释几个重要词汇:
    Fan:N/A是风扇转速,从0到100%之间变动,这个速度是计算机期望的风扇转速,实际情况下如果风扇堵转,可能打不到显示的转速。有的设备不会返回转速,因为它不依赖风扇冷却而是通过其他外设保持低温。
    Temp:温度,单位:℃。
    Perf:性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能。
    Disp.A:Display Active,表示GPU的显示是否初始化。
    Memory Usage:显存使用率。
    GPU-Util:GPU利用率。