最近因为各种事给不下四台机器安装深度学习的环境,有win10,还有Ubuntu,查看各种官方文档,虽然还有好多没弄明白的,因为懒所以决定这次写个安装说明,给以后的自己看。
NVDIA driver search page搜索你的显卡需要的驱动型号并下载(如图)。
下面是我的电脑对应的驱动版本:
从搜索的结果可以看到,我的驱动对应的版本应该是440.64
既然官方说这个版本可以,那下载就完事了。接下载开始安装:由于我下载了.run文件,所以就不用ppa的方式安装了,因为本人曾经因为失误不小心把电脑装成了砖。。具体记不清楚咋整的了。
1.安装显卡驱动
1.禁用nouveau
打开终端,输入:
sudo gedit /etc/modprobe.d/blacklist.conf
在blacklist.conf文件末尾加上这两行,并保存:
blacklist nouveau
options nouveau modeset=0
然后执行命令:
sudo update-initramfs -u //应用更改
重启电脑,验证是否禁用nouveau:
lsmod | grep nouveau
没有信息返回说明已禁用了如图:
2.安装NVIDIA驱动
打开terminal卸载旧版本NVIDIA驱动:
sudo apt-get remove --purge nvidia*
进入到下载好的.run文件夹下给驱动run文件赋予执行权限:
sudo chmod a+x NVIDIA-Linux-x86_64-440.64.run //对应自己下载的驱动名称
安装NVIDIA驱动
sudo ./NVIDIA-Linux-x86_64-440.64.run -no-x-check -no-nouveau-check -no-opengl-files
只有禁用opengl这样安装才不会出现循环登陆的问题
-no-x-check:安装驱动时关闭X服务
-no-nouveau-check:安装驱动时禁用nouveau
-no-opengl-files:只安装驱动文件,不安装OpenGL文件
安装过程中的选项:
The distribution-provided pre-install script failed! Are you sure you want to continue? 选择 yes 继续。
Would you like to register the kernel module souces with DKMS? This will allow DKMS to automatically build a new module, if you install a different kernel later? 选择 No 继续。
问题没记住,选项是:install without signing
问题大概是:Nvidia's 32-bit compatibility libraries? 选择 No 继续。
Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x? Any pre-existing x confile will be backed up. 选择 Yes
这些选项如果选择错误可能会导致安装失败,没关系,只要前面不出错,多尝试几次就好。
查看NVIDIA版本检验是否安装完成
参考:
环境搭建01--Ubuntu如何查看显卡信息及安装NVDIA显卡驱动_运维_澄宁的博客-CSDN博客blog.csdn.net
2.安装CUDA
去官方网站下载符合自己电脑的cuda版本,选择好相应的版本后按照下面提供的方式进行安装。
安装CUDA,安装版本需要和当前驱动版本对应,具体对应要去英伟达的官方网站查询,这个表应该会随着时间更新,因为我是440.64,按照表我可以下载最新的cuda10.2的版本
运行进入如下页面
sudo sh cuda_10.2.89_440.33.01_linux.run
选accept
这个地方不要下载Driver,因为之前已经安装完了,一定要选择CUDA Toolkit 10.2,下面的选填,我觉得把sample下载下来还挺把握,可能安装之后还需要测试一下。接下来点击install。
看到这页面估计是安装完了,输入以下命令验证是否成功:
cat /usr/local/cuda/version.txt
接下来设置环境变量
sudo vim ~/.bashrc
加入如下环境变量:
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-10.2/lib64
export PATH=$PATH:/usr/local/cuda-10.2/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-10.2
保存退出,终端运行:
source ~/.bashrc
检查:nvcc --version,如果显示下面的文子就说明安装成功了。
官网给出安装样本的可写副本,然后构建并运行nbody样本来测试cuda,我没测,先记下来:
cuda-install-samples-10.2.sh ~
cd ~/NVIDIA_CUDA-10.2_Samples/5_Simulations/nbody
make
./nbody
遇坑记:下面是我按照官方配置的情况
点击最下面的《cuda快速入门指南》找到这个地方
但是这个时候停住,当我执行了sudo nvida-xconfig之后问题来了,我重启了电脑后,就开始循环进入登录页面了,具体我也不知道为啥,还请大神赐教,官方不行就自己另辟蹊径了。。虽然很不爽。
3.安装cuDNN
到官网下载选择对应的版本,注意有三个包
注意三个deb的包需要全部下载下来,执行
sudo dpkg -i libcudnn7_7.6.5.32-1+cuda10.2_amd64.deb
sudo dpkg -i libcudnn7-dev_7.6.5.32-1+cuda10.2_amd64.deb
sudo dpkg -i libcudnn7-doc_7.6.5.32-1+cuda10.2_amd64.deb
检查CUDNN是否安装
cd /usr/src/cudnn_samples_v7/mnistCUDNN
sudo make clean
sudo make(出错了,提示没有安装g++,那就安装一下,这里大家遇到的问题可能都不太一样,就是看他缺啥,咱就补啥就行)
//卸载g++:
sudo apt-get remove g++
//重装:
sudo apt-get install g++
./mnistCUDNN
显示test passed!证明cuDNN安装成功了!!终于完事了!!!