• Ubuntu系统:安装Ubuntu 20.04 LTS稳定版本。
  • vim: ubuntu常用文本编译器。(可以不用)
  • SSH: 远程连接工具。
  • frp: 内网穿透,自己配置的电脑很难获取独立IP地址,需要用一个第三方,有独立IP地址的服务器,最为桥梁,传递客户端与服务器的数据,实现远程访问的效果。(可以没有)
  • xrdp: 远程桌面连接,安装后可以用Windows自带的远程桌面连接软件,访问Ubuntu服务器。(其实用xshell就行)
  • SAMBA: 远程挂载硬盘,可以把Ubuntu系统下面的硬盘挂在在Windows系统下。(其实用xshell就行)
  • 显卡: 指硬件部分,如3080,3090显卡,能看得见摸得着。
  • 显卡驱动: 通常指NVIDIA Driver,是连接硬件和软件的桥梁,没有驱动,系统就无法识别显卡,也就无法使用显卡。
  • cuda: C语言在GPU编程上的拓展包工具库,是显卡驱动之上的一个并行运算平台的,可以解决复杂的并行计算问题。
  • CuDNN: 在cuda基础上专门为深度学习设计的相关工具库,封装了卷积等算子的库,安装CuDNN才能完成深度学习优化和加速计算。
  • Conda: 一个开发环境管理工具,在开发过程中,经常会用到不同版本的python、pytorch或者其他包,但是同一环节只能安装一个版本的库,conda就可以帮我们隔离出不同的环境,在不同的环境中安装不同版本的库。
  • pytorch: 深度学习开发框架,很多底层的深度学习功能都已经实现,我们只需要调用,就能完成我们的项目,不需要从新造轮子。
  • PyChram:是一种python的编译器工具,带有可以提高开发效率的工具,比如调试、代码跳转、智能提示、代码补全等。适合大型项目。

安装 ubuntu系统

下载 Ubuntu 20.04 LTS

https://ubuntu.com/download/desktop

制作 u盘启动, 常用的两个u启动制作工具 UltraISO 和 Rufus, 把Ubuntu系统烧录在U盘后插需要安装的电脑

安装 ubuntu,一键u启动(以主板为准,安装过程省略)

Pytorch~ubuntu20.04搭建_python

配置 ubuntu环境和软件安装

设置root密码

sudo passwd root

更换 ubuntu 的国内源

备份默认源

# 备份默认源

sudo cp /etc/apt/sources.list /etc/apt/sources.list.bak      
sudo gedit /etc/apt/sources.list

回复默认源:sudo cp /etc/apt/sources.list.bak /etc/apt/sources.list

内容替换为:

deb http://mirrors.aliyun.com/ubuntu/ focal main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ focal main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ focal-security main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ focal-security main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ focal-updates main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ focal-updates main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ focal-proposed main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ focal-proposed main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu/ focal-backports main restricted universe multiverse
deb-src http://mirrors.aliyun.com/ubuntu/ focal-backports main restricted universe multiverse

更新软件列表

sudo apt update           # 更新apt软件源
sudo apt upgrade          # 更新

报错 ERROR:Unable to lock directory /var/lib/apt/lists/

sudo rm /var/cache/apt/archives/lock
sudo rm /var/lib/dpkg/lock
sudo dpkg --configure -a

报错 ERROR:Could not get lock /var/lib/dpkg/lock-frontend.

ps aux|grep apt
sudo kill -9 pid

安装 vim

sudo apt install vim

安装 SSH(远程连接)

sudo apt install ssh  
#使用:ssh -p 22 root@192.168.31.176

安装 frp(客户端和服务端都需要下载)(可以直接xshell)

tar -zxvf frp_xxxx.tar.gz

服务端: 修改frps.ini内容改为:

[common]
#frp服务的端口号,本地服务器和云服务器保持一致
bind_port = 7000    
# frp的web界面的端口号,自己定义
dashboard_port = 7001         
# web界面的登陆账户,自己定义
dashboard_user = wentop 
# web界面的登陆密码,自己定义
dashboard_pwd = 123456
# frp验证方式,本地服务器和云服务器保持一致
authentication_method = token
# frp客户端连接时的密码,本地服务器和云服务器保持一致
token = 123456

启动服务端服务:

# 开启服务端  方法一
./frps -c ./frps.ini        
# 或者后台开启 方法二
nohup  ./frps -c ./frps.ini  &

客户端: 修改frpc.ini内容改为:

[common]
# 云服务器公网ip
server_addr = xx.xx.xx.xx
# 验证方式,本地服务器和云服务器保持一致               
authentication_method = token
# frp连接密码,本地服务器和云服务器保持一致          
token = 123456
# frp服务端口,本地服务器和云服务器保持一致                        
server_port = 8989
# 我们在访问 [本地服务器:22] 可直接用 [云服务器公网ip:222]方式访问

[Fusion-ssh]                            
# 方式
type = tcp
# 本地ip
local_ip = 127.0.0.1
# 本地穿透的端口
local_port = 22
# 映射的端口
remote_port = 222
 
[Fusion-xxx]
type = xxx
local_ip = 127.0.0.1
local_port = xxx
remote_port = xxx

启动客户端服务:

#开启客户端服务  方法一
./frpc -c ./frpc.ini
# 或者后台开启  方法二
nohup  ./frpc -c ./frpc.ini  &

安装 xrdp(远程桌面连接)

sudo apt install xrdp                  # 安装,默认自动启动
sudo systemctl status xrdp             # 验证是否在运行
sudo adduser xrdp ssl-cert             # 添加xrdp用到到ssl-cert组,不修改,默认只读
sudo systemctl restart xrdp            # 重启xrdp服务

配置好后,就可以用Windows自带的远程桌面软件输入服务器的IP地址,就可以访问服务器。

Pytorch~ubuntu20.04搭建_python_02

安装 SAMBA(远程挂载硬盘)

sudo apt-get install samba samba-common-bin   # 安装SAMBA
sudo gedit /etc/samba/smb.conf                # 配置文件

在文件末尾添加下面内容(注释需单独一行)

# 共享文件夹的命名
[home]
# 可以访问挂载硬盘的用户                                
comment = Fusion WorkStation Storage  
# 共享文件的路径
valid users = wenjtop,root   
# 可被其他人看到资源名称         
path = /home/wenjtop/ 
# 文件可写               
browseable = yes    
# 新建文件的权限为 664                  
writable = yes                        
create mask = 0664  
# 新建目录的权限为 775                     
directory mask = 0775

添加ubuntu以存在的用户wenjtop

sudo smbpasswd -a wenjtop             # 添加用户wenjtop
sudo /etc/init.d/samba-ad-dc restart  # 重启服务

客户端操:我的电脑->计算机->映射网盘驱动->输入:\\192.168.188.41\home

Pytorch~ubuntu20.04搭建_ubuntu_03

安装搜狗拼音

安装fcitx输入框架

sudo apt install fcitx-bin
sudo apt-get install fcitx-table

选择fcitx框架,后重启

Pytorch~ubuntu20.04搭建_ubuntu_04

选择fcitx框架

现在就可以选择系统自带拼音(安装ubuntu时选择中文)

Pytorch~ubuntu20.04搭建_人工智能_05

添加图片注释,不超过 140 字(可选)

下载搜狗拼音

http://pinyin.sogou.com

安装

sudo dpkg -i sogou...版本号.deb

# 若缺少依赖输入:sudo apt install 查看安装依赖包的命令行。

language->manage installed languages->输入法系统改成fcitx->重启

Pytorch~ubuntu20.04搭建_ubuntu_06

安装 google浏览器

sudo dpkg -i google-chrome-stable_current_amd64.deb     # 安装

安装向日葵

https://sunlogin.oray.com/download?categ=ent

sudo dpkg -i ./SunloginClient_11.0.1.44968_amd64.deb

修改pip源

sudo mkdir ~/.pip
sudo vim ~/.pip/pip.conf

内容替换为:

[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple/ 
[install]
trusted-host = pypi.tuna.tsinghua.edu.cn

安装显卡驱动

Pytorch~ubuntu20.04搭建_云服务_07

 我的ROG电脑,怎么都不行安装完了,也是有冲突开不了~~ 可烦死我了

重启

Pytorch~ubuntu20.04搭建_人工智能_08

安装 CUDA 11.3

https://developer.nvidia.com/cuda-11.3.0-download-archive?target_os=Linux&target_arch=x86_64&Distribution=Ubuntu&target_version=20.04&target_type=deb_local

Pytorch~ubuntu20.04搭建_python_09

输入下面命令行:

wget https://developer.download.nvidia.com/compute/cuda/11.3.0/local_installers/cuda_11.3.0_465.19.01_linux.run
sudo sh cuda_11.3.0_465.19.01_linux.run

如果安装驱动,就取消Driver

添加路径,修改.bashrc 文件:

sudo gedit ~/.bashrc

# 在末尾添加:
export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

# 更新:
source ~/.bashrc

Pytorch~ubuntu20.04搭建_ubuntu_10

 安装成功:nvcc -V 

Pytorch~ubuntu20.04搭建_ubuntu_11

安装 CuDNN

https://developer.nvidia.com/rdp/cudnn-download

需要注册登陆,下载cuDNN Library for Linux (x86_64)。

Pytorch~ubuntu20.04搭建_人工智能_12

cuDNN Library for Linux (x86_64) 

# 解压
tar -xzvf cudnn-11.3-linux-x64-v8.2.1.32.tgz

# 复制到 cuda路径下
sudo cp cuda/lib64/* /usr/local/cuda-11.3/lib64/
sudo cp cuda/include/* /usr/local/cuda-11.3/include/

# 查看CUDNN的版本信息
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

Pytorch~ubuntu20.04搭建_ubuntu_13

显示如上,说明安装成功。

Miniconda 安装

下载

https://docs.conda.io/en/latest/miniconda.html#

Pytorch~ubuntu20.04搭建_python_14

安装

chmod +777 ./Miniconda3-latest-Linux-x86_64.sh
./Miniconda3-latest-Linux-x86_64.sh

更换源

https://mirror.tuna.tsinghua.edu.cn/help/anaconda/

sudo gedit ~/.condarc

复制内容到.condarc

channels:
  - defaults
show_channel_urls: true
default_channels:
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
custom_channels:
  conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  msys2: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  bioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  menpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  pytorch-lts: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  simpleitk: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud

创建conda环境和激活环境

conda create -n torch python=3.8        # 创建环境  name表示环境名
conda activate torch                    # 激活环境  name表示环境名

 

Pytorch~ubuntu20.04搭建_python_15

显示如上,说明安装成功。

conda 常用命令 (用这个安装可简单了)

conda --version                                  # 查看conda版本
conda update conda                               # 更新至最新的conda

conda update --all                               # 更新当前环境所有包
conda update package_name                        # 指定包至最新

conda env list                                   # 查看已有的虚拟环境
conda create -n python_3.9 python=3.9            # 创建虚拟环境
conda create --name Py_3.9 --clone python_3.9    # 复制虚拟环境
conda activate python_3.9                        # 激活虚拟环境
conda remove -n python_3.9 --all                 # 删除虚拟环境

conda list                                       # 查看当前环境所有包情况
conda search numpy                               # 查看numpy有哪些版本

conda install numpy                              # 安装numpy包在当前环境
conda remove numpy                               # 删除当前环境中的numpy包

conda config --remove-key channels               # 回复默认源

conda install anaconda-clean                     # 卸载conda
anaconda-clean
anaconda-clean --yes

安装 pytorch

选择Pytorch版本

nvcc -V   #查看Pytorch对应的cuda版本,显示release 11.3, V11.3.58

在官网查找conda命令

https://pytorch.org/get-started/previous-versions/

命令行里面输入nvcc -V,查看cuda版本,若cuda为11.3,就选择下图标注框里的命令行安装。

conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch

我们在安装显卡驱动时会安装cudatoolkit,在安装pytorch时也会安装cudatoolkit?安装显卡驱动时,cudatoolkit是一个完整安装包,而安装pytorch时安装的cudatoolkit只会安装pytorch会使用的部分,两个cudatoolkit是独立的,都在工作在显卡驱动上,所以我们还需要安装cudnn。cudatoolkit和cuda版本必须一样。

验证是否安装成功

Pytorch~ubuntu20.04搭建_python_16

安装 pychram

ubuntu software直接搜索pychram。或者下面链接访问官网。

 或者官网下载压缩包