步骤
- 一、查个人电脑型号
- 二、查版本是否支持
- 三、下载安装并配置
- 1.安装cuda
- 2.安装cuDNN
- 3.安装tensorflow-gpu
- 4.其他
- ①出错:找不到指定的模块
- ②如果想让电脑用CPU运算
- ③Windows查看GPU使用情况
一、查个人电脑型号
- 点击【此电脑】——【管理】——【设备管理器】
- 查看【显示适配器】的第二个
二、查版本是否支持
- 网页搜索【型号+SPECIFICATION】,进入GeForce官网
- 看到支持,你就放心了
三、下载安装并配置
- 找到需要的Tensorflow型号和环境 ,点击→Tensorflow官网
- 同时给出下图
1.安装cuda
- 根据上图选择合适版本
- 点击【控制面板】——【NVIDIA控制面板】——【左下角系统信息】——【组件】
- 进入 cuda官网 选择并下载你合适的版本
- 默认位置安装exe文件
- 选择【自定义】安装
- 只需选择CUDA下面这4项就够了(默认是全选的),当然你也可以默认
- 检查,打开Anaconda Prompt
nvcc -V
- 表明成功!
2.安装cuDNN
- 选择合适版本
- 进入 cuDNN官网 选择并下载你合适的版本
- 官网需要注册才能下载,这个无关紧要,注册以后下载就好
- 把下载后的压缩文件解压缩,分别将cuda/include、cuda/lib、cuda/bin三个目录中的内容拷贝到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0(随版本定)对应的include、lib、bin目录下即可
- 设置环境变量
右击【计算机】,打开【属性】——【高级系统设置】——【环境变量】 - 可以看到,系统中已经增加CUDA_PATH和CUDA_PATH_V8_0两个系统变量
继续添加:
①CUDA_SDK_PATH = C:\ProgramData\NVIDIA Corporation\CUDA Samples\v9.0
②CUDA_LIB_PATH = %CUDA_PATH%\lib\x64
③CUDA_BIN_PATH = %CUDA_PATH%\bin
④CUDA_SDK_BIN_PATH = %CUDA_SDK_PATH%\bin\win64
⑤CUDA_SDK_LIB_PATH = %CUDA_SDK_PATH%\common\lib\x64在系统变量 PATH 添加:
%CUDA_LIB_PATH%;%CUDA_BIN_PATH%;%CUDA_SDK_LIB_PATH%;%CUDA_SDK_BIN_PATH%;
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\lib\x64;
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\bin;
C:\ProgramData\NVIDIA Corporation\CUDA Samples\v9.0\common\lib\x64;
C:\ProgramData\NVIDIA Corporation\CUDA Samples\v9.0\bin\win64;
如果你设置的自定义路径,上述路径要相应替换为你的自定义路径
- 使用cuda内置的deviceQuery.exe 和 bandwithTest.exe检查
- 打开Anaconda Prompt
cd C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\extras\demo_suite
bandwidthTest.exe
deviceQuery.exe
- 执行完,两次都返回Result=PASS,那么就成功了!!!
3.安装tensorflow-gpu
- 最快方法是利用镜像,下载合适版本的tensorflow-gpu的whl文件,打开Anaconda Prompt(对于cuda=9.0,cuDNN=7.0,选择tensorflow-gpu=1.12)
pip install tensorflow_gpu-1.12.0-cp35-cp35m-win_amd64.whl
- 安装成功后,利用下面代码检查
import tensorflow as tf
# Creates a graph.
a = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[2, 3], name='a')
b = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[3, 2], name='b')
c = tf.matmul(a, b)
# Creates a session with log_device_placement set to True.
sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))
# Runs the op.
print(sess.run(c))
- 出现上图中
device:GPU:0
- 表明该运算用到了GPU,即安装成功
4.其他
①出错:找不到指定的模块
ImportError: DLL load failed: 找不到指定的模块
- 最有可能的就是tensorflow和cuDNN版本不一致,就需要卸载重安装
- 如何卸载,看一篇网友写的:windows如何卸载
②如果想让电脑用CPU运算
- 可以参考 tensorflow官方指导
③Windows查看GPU使用情况
cd C:\Program Files\NVIDIA Corporation\NVSMI
nvidia-smi
- 如果没有NVSMI文件怎么办
- 下载并解压至:C:\Program Files\NVIDIA Corporation,即可
百度网盘:https://pan.baidu.com/s/1glLHQc-lY4PFxxi3rFdkCg 提取码: 4hqa
- 解释几个重要词汇:
Fan:N/A是风扇转速,从0到100%之间变动,这个速度是计算机期望的风扇转速,实际情况下如果风扇堵转,可能打不到显示的转速。有的设备不会返回转速,因为它不依赖风扇冷却而是通过其他外设保持低温。
Temp:温度,单位:℃。
Perf:性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能。
Disp.A:Display Active,表示GPU的显示是否初始化。
Memory Usage:显存使用率。
GPU-Util:GPU利用率。