Deepin20.6 RTX3080 安装显卡驱动510.60.02、CUDA11.6、PyTorch1.11

  • 0 前言
  • 1 准备工作
  • 2 清理环境
  • 3 安装显卡驱动
  • 4 安装PyTorch & CudaToolKit
  • 5 检查


0 前言

近期有个目标检测的任务,需要使用CUDA训练网络模型,使用的设备是RTX3080,在Deepin操作系统下,安装了510.60.02版本的驱动,简单记录下操作步骤,以备不时之需

1 准备工作

网上有很多帖子是通过英伟达官网下载.run格式的驱动来手工安装的,但是我尝试了很多版本,虽然能装上,但是装完之后无法开机,因此,在开始安装显卡驱动可CUDA套件前,建议先备份一下当前的操作系统

2 清理环境

卸载当前已经安装的英伟达驱动

sudo apt autoremove nvidia*

屏蔽开源驱动

sudo vi /etc/modprobe.d/blacklist.conf

按i进入vi的编辑模式,添加以下几行内容,然后ESC进入命令模式wq进行保存

blacklist nouveau   
blacklist lbm-nouveau   
options nouveau modeset=0 
alias nouveau off   
alias lbm-nouveau off

如果开机卡黑屏,或者开机有如下警告

nvidiafb: cannot request PCI regions

可以在上述文件中多添加一行

blacklist nvidiafb

文件保存成功后,执行下面的命令,完成内核模块的屏蔽

sudo update-initramfs -u

重启机器,使用下面的命令检查,没有输出就屏蔽成功了

lsmod | grep nouveau

3 安装显卡驱动

不知道是Deepin的系统原因还是我台式机的原因,英伟达官网.run形式的驱动文件我装不成功,装上以后开机卡黑屏,然后在Deepin官方仓库里找到了可以直接使用的driver…

sudo apt search nvidia-driver
...
...
glx-alternative-nvidia/未知,now 1.2.0-1-1+eagle amd64 [已安装,自动]
  allows the selection of NVIDIA as GLX provider
libegl-nvidia0/未知,now 510.60.02-1 amd64 [已安装,自动]
  NVIDIA binary EGL library
...
...

喜出望外,直接install,一把梭哈,成功!

sudo apt install nvidia-driver
# 命令执行完成后 检查是否成功 成功的话 nvidia-smi会有显卡信息输出
nvidia-smi

4 安装PyTorch & CudaToolKit

我安装的510.60.02版本自带的CUDA版本是11.6,在pytorch官网可以看到,当前最新PyTorch Stable版本是1.11.0,支持CUDA 11.3,CUDA11系列向下兼容低版本,选择自己的安装方式安装PyTorch 1.11.0即可,下方会有安装命令,贴终端跑一下完事,(记得更换conda或者pip到国内源,快一些)

conda安装

conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch

pip安装

pip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113

3080机器学习常用的驱动版本 3080最新驱动版本_CUDA

5 检查

终端输入python or python3,进入python交互环境,检查下PyTorch和CUDA的版本,以及CUDA是否可用,至此,Deepin20.6+RTX3080安装显卡驱动、PyTorch、CUDA工作完成

>>> import torch
>>> torch.__version__
'1.11.0+cu113'
>>> torch.cuda.is_available()
True
>>> torch.version.cuda
'11.3'
>>>