Deepin20.6 RTX3080 安装显卡驱动510.60.02、CUDA11.6、PyTorch1.11
- 0 前言
- 1 准备工作
- 2 清理环境
- 3 安装显卡驱动
- 4 安装PyTorch & CudaToolKit
- 5 检查
0 前言
近期有个目标检测的任务,需要使用CUDA训练网络模型,使用的设备是RTX3080,在Deepin操作系统下,安装了510.60.02版本的驱动,简单记录下操作步骤,以备不时之需
1 准备工作
网上有很多帖子是通过英伟达官网下载.run格式的驱动来手工安装的,但是我尝试了很多版本,虽然能装上,但是装完之后无法开机,因此,在开始安装显卡驱动可CUDA套件前,建议先备份一下当前的操作系统
2 清理环境
卸载当前已经安装的英伟达驱动
sudo apt autoremove nvidia*
屏蔽开源驱动
sudo vi /etc/modprobe.d/blacklist.conf
按i进入vi的编辑模式,添加以下几行内容,然后ESC进入命令模式wq进行保存
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off
如果开机卡黑屏,或者开机有如下警告
nvidiafb: cannot request PCI regions
可以在上述文件中多添加一行
blacklist nvidiafb
文件保存成功后,执行下面的命令,完成内核模块的屏蔽
sudo update-initramfs -u
重启机器,使用下面的命令检查,没有输出就屏蔽成功了
lsmod | grep nouveau
3 安装显卡驱动
不知道是Deepin的系统原因还是我台式机的原因,英伟达官网.run形式的驱动文件我装不成功,装上以后开机卡黑屏,然后在Deepin官方仓库里找到了可以直接使用的driver…
sudo apt search nvidia-driver
...
...
glx-alternative-nvidia/未知,now 1.2.0-1-1+eagle amd64 [已安装,自动]
allows the selection of NVIDIA as GLX provider
libegl-nvidia0/未知,now 510.60.02-1 amd64 [已安装,自动]
NVIDIA binary EGL library
...
...
喜出望外,直接install,一把梭哈,成功!
sudo apt install nvidia-driver
# 命令执行完成后 检查是否成功 成功的话 nvidia-smi会有显卡信息输出
nvidia-smi
4 安装PyTorch & CudaToolKit
我安装的510.60.02版本自带的CUDA版本是11.6,在pytorch官网可以看到,当前最新PyTorch Stable版本是1.11.0,支持CUDA 11.3,CUDA11系列向下兼容低版本,选择自己的安装方式安装PyTorch 1.11.0即可,下方会有安装命令,贴终端跑一下完事,(记得更换conda或者pip到国内源,快一些)
conda安装
conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch
pip安装
pip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113
5 检查
终端输入python or python3,进入python交互环境,检查下PyTorch和CUDA的版本,以及CUDA是否可用,至此,Deepin20.6+RTX3080安装显卡驱动、PyTorch、CUDA工作完成
>>> import torch
>>> torch.__version__
'1.11.0+cu113'
>>> torch.cuda.is_available()
True
>>> torch.version.cuda
'11.3'
>>>