常用linux指令:

切root:Sudo su

创建新用户:adduser cjl

分享conda环境:cp .bashrc /home/wcf/.bashrc

改变普通登陆用户:su cjl

释放文件读写权限:chmod -R 777 name

常用conda指令:

切root:Sudo su

创建新用户:adduser cjl

分享conda环境:cp .bashrc /home/wcf/.bashrc

改变普通登陆用户:su cjl

释放文件读写权限:chmod -R 777 name

常用GPU调度指令:

显示显卡状态:watch -n 5 nvidia-smi

清空显存:sudo fuser -v /dev/nvidia* |awk '{for(i=1;i<=NF;i++)print "kill -9 " $i;}' | sudo sh

后台运行:nohup python my.py >> /usr/local/python/xxf/my.log 2>&1 &

查看所有后台进程:ps -ef

关闭进程;kill -9  进程号

安装GPU驱动:

1.删除原有NVIDIA驱动

sudo apt-get remove --purge nvidia*

2.禁用nouveau

sudo vim /etc/modprobe.d/blacklist.conf

在最后一行添加

blacklist nouneau

执行

sudo update-initramfs -u

3.重启

lsmod | grep nouveau # 没输出代表禁用生效,要在重启之后执行

4.从NVIDIA显卡驱动下载对应的显卡驱动

官方 GeForce 驱动程序 | NVIDIA

选择最新的版本获得.run文件

5.安装

sudo chmod a+x NVIDIA-Linux-x86_64-418.43.run

sudo sh NVIDIA-*.run --no-opengl-files --no-x-check --no-nouveau-check

  • –no-opengl-files 只安装驱动文件,不安装OpenGL文件。这个参数最重要
  • –no-x-check 安装驱动时不检查X服务
  • –no-nouveau-check 安装驱动时不检查nouveau

 安装过程中的可以按默认设置点击

6.检验是否安装成功,命令nvidia-smi

安装miniconda:

1、下载安装包:wget -c https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh

给予运行权限:chmod 777 Miniconda3-latest-Linux-x86_64.sh

运行安装:sh Miniconda3-latest-Linux-x86_64.sh

2、这个不做应该也行,自动添加了:vim .bashrc 在尾部添加  export PATH="/mnt/inspurfs/user-fs/tuguoqing/miniconda3/bin:"$PATH

创建虚拟环境 conda create -n [环境名] python=3.6

配置conda源

安装cuda:

建议按顺序装一遍

1、# 系统升级
sudo apt-get update -y
sudo apt-get upgrade -y
# 安装python基础开发包
sudo apt install -y python-dev python-pip python-nose gcc g++ git gfortran vim build-essential

2、#安装运算加速库

sudo apt install -y libopenblas-dev liblapack-dev libatlas-base-dev

3、官网下载cuda:https://developer.nvidia.com/cuda-downloads ,选择runfile(local)类型文件安装

我选了11.6

4、chmod 777 cuda_11.0.3_450.51.06_linux.run # 修改权限

sudo ./cuda_11.0.3_450.51.06_linux.run # 运行安装

GPU unlock_miniconda

 不要安装OpenGL。这里建议驱动和cuda分开装,这里不用再装驱动,文档也没必要,毕竟有在线文档

GPU unlock_ubuntu_02

5、 显示了安装路径及log,需要确保的路径配置。

 将CUDA路径添加至环境变量,在终端输入sudo vim  ~/.bashrc

末尾添加后再source ~/.bashrc即可

# cuda path
# ln -s /usr/local/cuda-11.0 /usr/local/cuda #建立软链接
export CUDA_HOME=/usr/local/cuda
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
测试安装完成:nvcc -V

安装cudnn,cuda安装成功可直接使用conda install cudnn下载最新cudnn

cudnn下载路径:cuDNN Archive | NVIDIA Developer

我选了11.3,没有和最新的cuda匹配的,没出问题

1、选动态库安装,点击下载,deb方式卸载更新起来不太方便

解压cudnn-11.0-linux-x64-v8.0.5.39.tgz

tar -xzvf cudnn-11.0-linux-x64-v8.0.5.39.tgz

2、拷贝.h 和 libs文件到cuda安装目录,并给予执行权限:

sudo cp -d cuda/include/cudnn*.h /usr/local/cuda/include
sudo cp -d cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

zerotier组网,外网访问实验室服务器

任何一个浏览器:首先访问zerotier官网:ZeroTier – Global Area Networking

GPU unlock_3080_03

https://www.zerotier.com/

登陆,点击创建网络,服务器和想要外网连接服务器的任意主机pc安装zerotier就可以通过ID加入这个组网,其中,建议先在路由器上进行设置,给服务器分配固定的IP地址,以免每次重启后更换ip,zerotier组网的原理实际是根据各个主机的IP映射到一个网关下,实现在同一个内网下的效果,所以当更新IP后就要重新申请根据组网ID加入组网,这样只要在一个组网下,用户就可以在任意地方根据zerotier分配的服务器组网IP访问服务器

 如下图,左边打勾即说明允许加入内网,就能根据垃圾桶图标右侧给的ip进行互相访问

GPU unlock_3080_04