ubuntu20.04.3配置过程记录
某种意义上说,配置过程比系统安装要复杂,坑也更多。过程记录,碰到很多问题,有自身问题,也有其他资料的准确性问题,准确性问题在我看来是不具有普遍性,该记录也可能存在此问题,仅供大家参考。
安装GPU驱动
一.准备工作
首先禁用nouveau,系统自带。 ubuntu关闭nouveau的方法:1.打开终端;2.输入命令查看nouveau驱动状态;3.备份系统黑名单;4.输入命令编辑系统黑名单;5.在系统黑名单配置文件中添加代码;6.使配置生效;7.重启ubuntu;8.检查是否禁用成功。
对于此步骤,其实我也不知道所以然,据说会有冲突等问题,索性就做了。以下方法亲测适合本机。
ubuntu关闭nouveau的方法:
1.使用快捷键【Ctrl+Alt+T】打开终端。
2.输入命令查看nouveau驱动状态。
lsmod | grep nouveau
3.在修改配置之前备份一下。
//备份系统黑名单
sudo cp /etc/modprobe.d/blacklist.conf /etc/modprobe.d/blacklist.conf_backup
4.输入命令编辑系统黑名单。
sudo gedit /etc/modprobe.d/blacklist.conf
5.在系统黑名单配置文件最下面添加以下代码。
blacklist nouveau
options nouveau modeset=0
6.更新配置信息使其生效。
sudo update-initramfs -u
7.重启一下ubuntu。
reboot
8.最后可以通过以下命令检查是否禁用成功。
lsmod | grep nouveau #无返回结果说明禁用成功
二.安装驱动
1.确定显卡所对应的驱动版本,常规有三种方法,软件更新/下载/直接在终端安装; 2.直接终端里安装:
安装过程再不赘述,很多教程;
遇到的问题是:安装完毕后,用nvidia-smi验证时,出现提示:
查了很多资料……都不管用……最后看到了此文:[重启]即:“这里会连带Nvidia的驱动一起升级一遍,更新到最新的驱动;更新完可能会出现nvidia-smi命令报错,再重启一下就解决了。”重启一下就解决了重启一下就解决了!
此文确实是大神级专家,大格局,稳准很!
重启后,再nvidia-smi后,出现了想要的:
至此,显卡驱动安装完毕!三.安装Anaconda3包管理工具
Anaconda(官方网站)就是可以便捷获取包且对包能够进行管理,同时对环境可以统一管理的发行版本。Anaconda包含了conda、Python在内的超过180个科学包及其依赖项。
1.推荐在清华源进行下载,我选择的是最新的Anaconda3-2021-**-**Linux-x86_64.sh,注意版本。
2.安装Anaconda3
下载成功后,切到anaconda安装包的路径(默认在“下载”,即:cd 下载),在该路径下执行:
sh Anaconda3-2021.05-Linux-x86_64.sh
开始安装:
a.一直按回车,直到协议结束,输入yes继续;
b.选择默认安装位置,按回车继续;
c.然后询问是否把anaconda3的路径加到环境变量里去,一定要选yes;
d.安装完成,重启终端;
e.检验是否安装成功:
source ~/.bashrc
python
回到根目录后(不是之前的安装目录),输入下面的指令可以启动Spyder, IPython, Jupyter Notebook,Anaconda Navigator
spyder #打开Spyder
ipython #打开IPython
jupyter notebook #打开Jupyter notebook
anaconda-navigator #打开Anaconda Navigator四.安装CUDA
官网下载地址:https://developer.nvidia.cn/cuda-downloads?target_os=Linux&target_arch=x86_64&Distribution=Ubuntu&target_version=20.04
注意:是cn不是com,用cn的速度要快很多!
1.终端输入:wget https://developer.download.nvidia.com/compute/cuda/11.4.2/local_installers/cuda_11.4.2_470.57.02_linux.run
显示:
另外会有:
前面已经卸载过旧版本了直接Continue就好。然后根据提示选择安装选项,注意不要勾选第一个安装显卡驱动的,因为之前已经安装过了。2.终端输入:sudo sh cuda_11.4.2_470.57.02_linux.run
3.进入下载目录,在终端运行以下指令,直接进行安装:
chmod +x cuda_11.4.2_470.57.02_linux.run
sudo sh cuda_11.4.2_470.57.02_linux.run
4.依次选择:continue->accept->取消选中显卡驱动->Install
以上的2,3中安装了两遍……???
等待安装完成即可,安装完成后可能会有警告,可以忽略。
5.配置环境变量:
运行:gedit ~/.bashrc
在文件最后加入以下语句:
export PATH=/usr/local/cuda-11.4/bin:LD_LIBRARY_PATH
设置立即生效,运行:
source ~/.bashrc
6.检测是否成功:
nvcc -V
即:
出现上述提示即说明安装成功
7.编译测试:
编译CUDA Samples,进入samples的安装目录,选择一个进行编译测试:
~cd ~/NVIDIA_CUDA-11.4_Samples/0_Simple/vectorAdd
~make
~sudo ./vectorAdd
正常的话会有相应输出,打印显卡的信息。即:
[Vector addition of 50000 elements]
Copy input data from the host memory to the CUDA device
CUDA kernel launch with 196 blocks of 256 threads
Copy output data from the CUDA device to the host memory
Test PASSED
Done
五.安装cuDNN
注意:CUDA的版本一定要和CUDNN的版本对应,必须是CUDNN支持的版本!
如:Download cuDNN v8.2.4 (September 2nd, 2021), for CUDA 11.4
1.进入官网https://developer.nvidia.cn/cudnn下载cudnn(Lxq770880).
2.下载完毕后,进入下载目录(cd 下载),在终端打开,解压下载的包,并将其拷贝到lib64和include这两个目录:
~下载:tar -zxf cudnn-11.4-linux-x64-v8.2.4.15.tgz
~下载:cd cuda
~下载/cuda:sudo cp lib64/* /usr/local/cuda/lib64/
~下载/cuda:sudo cp include/* /usr/local/cuda/include/
六.安装PyTorch
1.进入PyTorch官网,选择当前机器环境:
pip3 install torch1.9.1+cu111 torchvision0.10.1+cu111 torchaudio0.9.1 -f https://download.pytorch.org/whl/torch_stable.html
下载速度还行,一二十分钟——>这里有秘方!
最后,显示部分:
Requirement already satisfied: typing-extensions in ./anaconda3/lib/python3.8/site-packages (from torch1.9.1+cu111) (3.7.4.3)
Requirement already satisfied: pillow>=5.3.0 in ./anaconda3/lib/python3.8/site-packages (from torchvision0.10.1+cu111) (8.2.0)
Requirement already satisfied: numpy in ./anaconda3/lib/python3.8/site-packages (from torchvision0.10.1+cu111) (1.20.1)
Installing collected packages: torch, torchvision, torchaudio
Successfully installed torch-1.9.1+cu111 torchaudio-0.9.1 torchvision-0.10.1+cu111
2.测试:
进python:
(base) lxq@lxq-Precision-7550:~$ python
Python 3.8.8 (default, Apr 13 2021, 19:58:26)
[GCC 7.3.0] :: Anaconda, Inc. on linux
Type “help”, “copyright”, “credits” or “license” for more information.
import torch
import torchvision
torch.cuda.is_available()
True
至此,安装全部完成。
还有工业级大神的教程,相信大家都知道,这里不多说了。暂时记录到这里!
主要参考:
1.https://zhuanlan.zhihu.com/p/336429888