深度学习服务器常用命令

  • 零、Linux系统命令
  • 一、GPU类命令
  • 二、CPU类命令
  • 三、docker
  • 四、conda虚拟环境
  • 五、高效工具使用
  • 5.1 Xshell
  • 5.2 FileZilla Client


零、Linux系统命令

查看服务器id: 		hostname -I
查看Ubuntu系统信息:	lsb_release -a
查看python版本:		python -V

一、GPU类命令

查看显卡信息

nvidia-smi				(显示一次当前GPU占用情况)
nvidia-smi -l			(每秒刷新一次并显示)
watch -n 5 nvidia-smi 	(其中,5表示每隔6秒刷新一次终端的显示结果)

ubuntu-drivers devices	(查看显卡驱动)

释放显存

ps -ef | grep python脚本名 | awk '{print $2}' | xargs kill -9

二、CPU类命令

1.free命令

free –m

用于检查有关系统RAM的使用情况(查看系统的可用和已用内存)

2.vmstat 指令

vmstat -s(参数)

用于查看系统的内存存储信息,是一个报告虚拟内存统计信息的小工具,vmstat 命令报告包括:进程、内存、分页、阻塞 IO、中断、磁盘、CPU。

3./proc/meminfo 指令(难用,不直观)

cat /proc/meminfo

用于从/proc文件系统中提取与内存相关的信息。这些文件包含有 系统和内核的内部信息。

你还可以使用命令 less /proc/meminfo 直接读取该文件。通过使用 less 命令,可以在长长的输出中向上和向下滚动,找到你需要的内容。

4.top 指令

top -o %MEM

用于打印系统中的CPU和内存使用情况。

top 最好的地方之一就是发现可能已经失控的服务的进程 ID 号(PID)。有了这些 PID,你可以对有问题的任务进行故障排除(或 kill)。

5.htop 指令(这个好用,直观)

htop

详细分析CPU和内存使用情况。
如果你终端没安装 htop,先通过指令来安装。
命令格式:sudo apt-get update
接着输入以下指令
命令格式:sudo apt install htop

三、docker

容器基础操作

查看docker版本:				docker version
查看docker serever信息:		docker info

列出所有镜像:				docker images
列出所有容器:				docker ps
列出所有容器(包括退出的):	docker ps -a
资源利用率监控:				docker stats

----------------------传送文件----------------------------
Docker➡宿主机:	

docker cp 容器名或id:<docker容器内的路径> <本地保存文件的路径>

宿主机➡Docker:	

docker cp 本地文件的路径 容器名或id:<docker容器内的路径>
---------------------------------------------------------

下载镜像:					docker pull 镜像名:镜像版本
上传镜像:					docker push 仓库id/镜像名

容器打包成镜像:
从文件中加载镜像:				docker load -i {file-name}.tar.bz2

创建容器

docker run [OPTIONS] IMAGE[:TAG] [COMMAND] [ARG....]
 
#参数说明
--name="名字"           指定容器名字
-d                     后台方式运行
-it                    使用交互方式运行,进入容器查看内容
-p                     指定容器的端口
	-p ip:主机端口:容器端口  配置主机端口映射到容器端口
	-p 主机端口:容器端口(常用)
	-p 容器端口
-P                     随机指定端口
-e					   环境设置
-v					   主机路径:容器内路径 数据卷挂载

启动容器

docker start 容器id或名称          # 启动容器
docker restart 容器id或名称        # 重启容器

进入后台运行中的容器

docker exec -it 容器id或名称 /bin/bash

退出容器

exit 	# 停止容器并退出(后台方式运行则仅退出)

Ctrl+P+Q  # 不停止容器退出

暂停容器

docker pause 容器名或容器id

停止容器/杀死容器

docker stop 容器名或容器id

stop是优雅的退出,先发送SIGTERM信号,一段时间后,再发送SIGKILL信号。
容器中进程在收到SIGTERM后,会做一些“善后”工作,
比如:保存状态,处理当前请求等。
kill,发送SIGKILL信号,应用程序直接退出。

docker kill 容器名或容器id

删除容器

docker rm 容器名或容器id

四、conda虚拟环境

1、查看现有虚拟环境:		conda env list 或 conda info -e
2、创建虚拟环境:		conda create -n 环境名 python=X.X
3、linux激活环境:	source activate 环境名
windows激活环境:	activate 环境名

***********************清华源****************************
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes
*********************************************************

4、指定环境安装包:	conda install -n 环境名 包名 -i
指定环境删除包:	conda remove --name 环境名 包名
5、linux退出虚拟环境:	source deactivate 环境名
Windows退出虚拟环境:	deactivate 环境名
6、删除虚拟环境:	conda remove -n 环境名 --all