文章目录
- 一、安装Nvidia-Driver
- 1.1 安装
- 1.1.1 禁用nouveau驱动
- 1.1.2 下载驱动
- 1.1.3 卸载旧驱动
- 1.1.4 安装新驱动
- 1.2 关于NVIDIA Driver安装的说明
- 二、安装CUDA
- 1、下载CUDA
- 2、安装CUDA
- 3、添加环境变量
- 4、测试CUDA是否安装成功
- 三、安装cuDNN
- 1、下载cuDNN
- 2、安装cuDNN
- 3、测试cuDNN是否安装成功
一、安装Nvidia-Driver
1.1 安装
1.1.1 禁用nouveau驱动
输入以下命令打开blacklist.conf文件
sudo vim /etc/modprobe.d/blacklist.conf
在文本最后添加:
blacklist nouveau
options nouveau modeset=0
然后执行:
sudo update-initramfs -u
重启后,执行以下命令,如果没有屏幕输出,说明禁用nouveau成功:
lsmod | grep nouveau
1.1.2 下载驱动
在Nvidia官网下载对应的驱动https://www.nvidia.cn/Download/index.aspx? ,根据自己显卡的情况下载对应版本的显卡驱动,比如我的显卡是4090,如图选择
下载完成后,文件名为NVIDIA-Linux-x86_64-535.146.02.run
1.1.3 卸载旧驱动
首先使用快捷键Ctrl-Alt+F1进入tty模式,执行以下命令禁用X-Window服务,否则无法安装显卡驱动
sudo service lightdm stop
执行以下命令卸载原有显卡驱动
sudo apt-get f--purge remove "nvidia*"
1.1.4 安装新驱动
直接执行驱动文件即可安装新驱动,一直默认即可
sudo ./NVIDIA-Linux-x86_64-535.146.02.run
执行以下命令启动X-Window服务
sudo service lightdm start
最后执行重启命令,重启系统即可
reboot
1.2 关于NVIDIA Driver安装的说明
需要补充的几个点:
- NVIDIA Driver可以通过software&updates安装,也可以在终端使用apt-get安装,但这两种方式都不推荐(因为我试了都没用),最稳妥的方式是在NVIDIA官网下载.run文件手动安装
- 关于显卡驱动安装之后黑屏进不去系统的问题,如果是具有独显直连功能的笔记本,首先进入Windows系统切换到独显直连模式,然后进入Ubuntu系统。如果还是不行,那就进入到Recovery模式,卸载掉NVIDIA驱动,安装更低版本的NVIDIA驱动。
- 关于显卡驱动安装之后掉网卡、掉蓝牙的问题,一般更新一下网卡驱动就好了,请参考其它博主的博客,我也是装完之后掉线卡掉驱动,更新主板bios解决的。
- 最后,不建议安装最新版本的NVIDIA驱动,一方面是可能不稳定,另一方面第三方库没有及时更新,会导致各种奇奇怪怪的问题。
安装CUDA前的准备工作,使用快捷键Ctrl+Alt+T打开终端,输入
nvidia-smi
查看显卡驱动是否安装成功以及显卡驱动的相关信息。在这里我们可以看到CUDA Version:12.2,也就是说我目前的显卡驱动要求最低安装12.2版本的CUDA。
二、安装CUDA
1、下载CUDA
前往NVIDIA官网https://developer.nvidia.com/cuda-toolkit-archive,选择和NVIDIA显卡驱动版本相适应的CUDA版本,我这里选择12.2.0版本。
在跳转出来的界面选择系统信息和平台信息,我是Intel的CPU,Ubuntu20.04系统,依次选择Linux,X86_64,Ubuntu,20.04,runfile(local)。
选择完成后,会给出命令行下载和安装的指令。
使用快捷键Ctrl+Alt+T打开终端,输入以下指令下载.run文件,下载完成后的文件默认保存在Downloads/文件夹之下。
wget https://developer.download.nvidia.com/compute/cuda/12.2.3/local_installers/cuda_12.2.0_535.54.03_linux.run
2、安装CUDA
使用Files文件管理软件进入到Downloads文件夹,右键Open in Terminal在终端打开路径。运行以下指令开始安装CUDA
sudo sh cuda_12.2.0_535.54.03_linux.run
等待页面跳转,在新的页面,使用上下键移动光标,使用Enter键选择Continue。
之后,输入“accept”
重点来了!!!在这个界面,使用空格或者Enter键,取消选择Driver,即让方括号中没有X,然后移动光标到Install,使用Enter键进行安装。如果这里不取消Driver,会覆盖安装NVIDIA驱动,会导致诸如黑屏等等不确定的问题。
安装完成后显示如下界面,提醒我们添加环境变量。
3、添加环境变量
根据上述提示,依次输入如下指令,添加环境变量
export PATH=/usr/local/cuda-12.2/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-12.2/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
添加完成后,使用如下指令刷新环境变量。
source ~/.bashrc
4、测试CUDA是否安装成功
使用Ctrl+Alt+T新建终端,输入以下指令,显示CUDA版本信息,表明CUDA安装成功。
nvcc -V
三、安装cuDNN
1、下载cuDNN
在NVIDIA官网https://developer.nvidia.com/cudnn下载和CUDA版本对应的cuDNN。这里需要登录自己NVIDIA账号,没有账号的可以用邮箱注册一个账号。
该网页的主页会显示最新版本的cuDNN,这里我们点击Archived cuDNN Releases查看早期版本。
这里我选择安装次新版的8.9.6。
选择下载适配Ubuntu20.04、x86_64架构的Deb文件。
2、安装cuDNN
使用如下指令安装cuDNN。
sudo dpkg -i cudnn-local-repo-ubuntu2004-8.9.6.50_1.0-1_amd64.deb
之后,使用如下指令拷贝文件即可完成安装。
sudo cp /var/cudnn-local-repo-ubuntu2004-8.9.6.50/cudnn-local-5E60450C-keyring.gpg /usr/share/keyrings
3、测试cuDNN是否安装成功
使用cd命令进入指定目录,运行bandwidthTest程序,显示如下信息,说明cuDNN安装成功。
cd /usr/local/cuda-12.2/extras/demo_suite/
./bandwidthTest
再运行deviceQuery程序,显示显卡相关信息,同样测试通过。