信息显示注释
PID 进程id
PPID ⽗进程id
RUSER Real user name
UID 进程所有者的⽤户id
USER 进程所有者的⽤户名
GROUP 进程所有者的组名
TTY 启动进程的终端名。不是从终端启动的进程则显⽰为 ?
PR 优先级
I nice值。负值表⽰⾼优先级,正值表⽰低优先级
P 最后使⽤的CPU,仅在多CPU环境下有意义
%CPU 上次更新到现在的CPU时间占⽤百分⽐
TIME 进程使⽤的CPU时间总计,单位秒
TIME+ 进程使⽤的CPU时间总计,单位1100秒
%MEM 进程使⽤的物理内存百分⽐
VIRT 进程使⽤的虚拟内存总量,单位kb。VIRT=SWAP+RES
SWAP 进程使⽤的虚拟内存中,被换出的⼤⼩,单位kb。
RES 进程使⽤的、未被换出的物理内存⼤⼩,单位kb。RES=CODE+DATA
CODE 可执⾏代码占⽤的物理内存⼤⼩,单位kb
DATA 可执⾏代码以外的部分(数据段+栈)占⽤的物理内存⼤⼩,单位kb
SHR 共享内存⼤⼩,单位kb
nFLT 页⾯错误次数
nDRT 最后⼀次写⼊到现在,被修改过的页⾯数。
COMMAD 命令名命令⾏
WCHA 若该进程在睡眠,则显⽰睡眠中的系统函数名
ni: nice值
pri: priority 优先级
rtprio: 实时优先级
psr: processor CPU编号
pstree

以树状形式显示父子进程

格式

pstree [OPTION] [ PID | USER ]
-p 显示PID
-T 不显示线程thread,默认显示线程
-u 显示用户切换
-H pid 高亮显示指定进程及其父进程

51、进程管理和性能相关工具_&

ps

process state查看进程状态

格式 ps [option]...

支持三种选项:
UNIX选项 如: -A -e
BSD选项 如: a
GNU选项 如: --help
a 选项包括所有终端中的进程
x 选项包括不链接终端的进程
u 选项显示进程所有者的信息
f 选项显示进程树,相当于 --forest
k|--sort 属性 对属性排序,属性前加 - 表示倒序
o 属性… 选项显示定制的信息 pid、cmd、%cpu、%mem
L 显示支持的属性列表
-C cmdlist 指定命令,多个命令用,分隔
-L 显示线程
-e 显示所有进程,相当于-A
-f 显示完整格式程序信息
-F 显示更完整格式的进程信息
-H 以进程层级格式显示进程相关信息
-u userlist 指定有效的用户ID或名称
-U userlist 指定真正的用户ID或名称
-g gid或groupname 指定有效的gid或组名称
-G gid或groupname 指定真正的gid或组名称
-p pid 显示指pid的进程
--ppid pid 显示属于pid的子进程
-t ttylist 指定tty,相当于 t
-M 显示SELinux信息,相当于Z

输出
C : ps -ef 显示列 C 表示cpu利用率
VSZ: Virtual memory SiZe,虚拟内存集,线性内存
RSS: ReSident Size, 常驻内存集
STAT:进程状态
R:running
S: interruptable sleeping示例:
常用组合:
范例:查看进程详细信息
范例:
D: uninterruptable sleeping
T: stopped
Z: zombie
+: 前台进程
l: 多线程进程
L:内存分页并带锁
N:低优先级进程
<: 高优先级进程
s: session leader,会话(子进程)发起者
I:Idle kernel thread,CentOS 8 新特性
ni: nice值
pri: priority 优先级
rtprio: 实时优先级
psr: processor CPU编号

常用组合
aux
-ef
-eFH
-eo pid,tid,class,rtprio,ni,pri,psr,pcpu,stat,comm
axo stat,euid,ruid,tty,tpgid,sess,pgrp,ppid,pid,pcpu,comm

51、进程管理和性能相关工具_ps_02

51、进程管理和性能相关工具_ps_03

51、进程管理和性能相关工具_kill_04

51、进程管理和性能相关工具_ps_05

#查询你拥有的所有进程
ps -x
#显示指定用户名(RUID)或用户ID的进程
ps -fU apache
ps -fU 48
#显示指定用户名(EUID)或用户ID的进程
ps -fu lgw
ps -fu 1000
#查看以root用户权限(实际和有效ID)运行的每个进程
ps -U root -u root
#列出某个组拥有的所有进程(实际组ID:RGID或名称)
ps -fG nginx
#列出有效组名称(或会话)所拥有的所有进程
ps -fg mysql
ps -fg 27
#显示指定的进程ID对应的进程
ps -fp 1234
#以父进程ID来显示其下所有的进程,如显示父进程为1234的所有进程
ps -f --ppid 1234
#显示指定PID的多个进程
ps -fp 1204,1239,1263
#要按tty显示所属进程
ps -ft pts/0
#以进程树显示系统中的进程如何相互链接
ps -e --forest
#以进程树显示指定的进程
ps -f --forest -C sshd
ps -ef --forest | grep -v grep | grep sshd
#要显示一个进程的所有线程,将显示LWP(轻量级进程)以及NLWP(轻量级进程数)列
ps -fL -C nginx
#要列出所有格式说明符
ps L
#查看进程的PID,PPID,用户名和命令
ps -eo pid,ppid,user,cmd面试题:找到未知进程的执行程序文件路径
范例:查看优先级和CPU绑定关系
范例:实现进程和CPU的绑定
#自定义格式显示文件系统组,ni值开始时间和进程的时间
ps -p 1234 -o pid,ppid,fgroup,ni,lstart,etime
#使用其PID查找进程名称:
ps -p 1244 -o comm=
#要以其名称选择特定进程,显示其所有子进程
ps -C sshd,bash
#查找指定进程名所有的所属PID,在编写需要从std输出或文件读取PID的脚本时这个参数很有用
ps -C httpd,sshd -o pid=
#检查一个进程的执行时间
ps -eo comm,etime,user | grep nginx
#排序,查找占用最多内存和CPU的进程
ps -eo pid,ppid,cmd,%mem,%cpu --sort=-%mem | head
ps -eo pid,ppid,cmd,%mem,%cpu --sort=-%cpu | head
#显示安全信息
ps -eM
ps --context
#使用以下命令以用户定义的格式显示安全信息
ps -eo euser,ruser,suser,fuser,f,comm,label
#使用watch实用程序执行重复的输出以实现对就程进行实时的监视,如下面的命令显示每秒钟的监视
watch -n 1 'ps -eo pid,ppid,cmd,%mem,%cpu --sort=-%mem | head'
进程和cpu绑定设置

51、进程管理和性能相关工具_pstree_06

prtstat

来自psmisc包,格式prtstat [option] PID...

选项 -r raw格式显示

51、进程管理和性能相关工具_进程管理_07

设置和调整进程优先级nice/renice

进程优先级:100-139

进程默认启动时nice至为0,优先级为120

只有根用户才能降低nice值(提高优先级)

格式 nice [option] [command [ARG]...]   -n 使用优先级去执行进程

51、进程管理和性能相关工具_&_08

51、进程管理和性能相关工具_进程管理_09

51、进程管理和性能相关工具_kill_10

renice [-n] priority pid 调整进程优先级

搜索进程pidof

ps aux | grep pattern

pidof [option] program...

-x 按脚本名称查找pid

51、进程管理和性能相关工具_ps_11

负载查询uptime

/proc/uptime 包括两个值,单位 s    系统启动时长  空闲进程的总时长(按总的CPU核数计算)

51、进程管理和性能相关工具_ps_12

uptime和w显示以下内容 当前时间 系统已启动时间 上线人数  系统平均负载(1 5 15分钟平均负载,一般不超1,超过5可能卡)

51、进程管理和性能相关工具_kill_13

51、进程管理和性能相关工具_进程管理_14

mpstat 显示CPU相关统计

51、进程管理和性能相关工具_&_15

top查看进程实时状态

排序 P:以cpu  M 内存   T 累计占据cpu时长time+

首部信息显示 l 时间信息  t tasks及cpu信息   1 显示cpu信息  m显示内存信息

退出命令q  刷新时间间隔s  终止指定进程k  保存文件W

51、进程管理和性能相关工具_进程管理_16

top命令栏位信息简介
us:用户空间
sy:内核空间
ni:调整nice时间
id:空闲
wa:等待IO时间
hi:硬中断
si:软中断(模式切换)
st:虚拟机偷走的时间
top选项:
-d # 指定刷新时间间隔,默认为3秒
-b 全部显示所有进程
-n # 刷新多少次后退出
-H 线程模式
free

显示内存使用状态

free [option]

-b 以字节为单位
-m 以MB为单位
-g 以GB为单位
-h 易读格式
-o 不显示-/+buffers/cache行
-t 显示RAM + swap的总和
-s n 刷新间隔为n秒
-c n 刷新n次后即退出
pmap

进程对应的内存映射

格式 pmap  [option] pid [...]

-x: 显示详细格式的信息

另外一种查找方式

cat /proc/pid/maps

strace cmd  查看系统调用

51、进程管理和性能相关工具_进程管理_17

vmstat

查看虚拟内存信息

格式 vmstat [option] [delay [count]]    -s 显示内存统计数据

procs:
r:可运行(正运行或等待运行)进程的个数,和核心数有关
b:处于不可中断睡眠态的进程个数(被阻塞的队列的长度)
memory:
swpd: 交换内存的使用总量
free:空闲物理内存总量
buffer:用于buffer的内存总量
cache:用于cache的内存总量
swap:
si:从磁盘交换进内存的数据速率(kb/s)
so:从内存交换至磁盘的数据速率(kb/s)
io:
bi:从块设备读入数据到系统的速率(kb/s)
bo: 保存数据至块设备的速率
system:
in: interrupts 中断速率,包括时钟
cs: context switch 进程切换速率
cpu:
us:Time spent running non-kernel code
sy: Time spent running kernel code
id: Time spent idle. Linux 2.5.41前,包括IO-wait time.
wa: Time spent waiting for IO. 2.5.41前,包括in idle.
st: Time stolen from a virtual machine. 2.6.11前, unknown.

51、进程管理和性能相关工具_进程管理_18

iostat 

统计cpu和设备IO信息

51、进程管理和性能相关工具_ps_19

dstat 

系统资源统计用于替换iostat vmstat,来自pcp-system-tools包

dstat [-afv] [option] [delay [count]]

-c 显示cpu相关信息
-C #,#,...,total
-d 显示disk相关信息
-D total,sda,sdb,...
-g 显示page相关统计数据
-m 显示memory相关统计数据
-n 显示network相关统计数据
-p 显示process相关统计数据
-r 显示io请求相关的统计数据
-s 显示swapped相关的统计数据
--tcp
--udp
--unix
--raw
--socket
--ipc
--top-cpu:显示最占用CPU的进程
--top-io: 显示最占用io的进程
--top-mem: 显示最占用内存的进程
--top-latency: 显示延迟最大的进程

51、进程管理和性能相关工具_进程管理_20

iotop

监视磁盘

iftop

显示网络带宽使用情况

nload

查看网络实时吞吐量

lsof

查看进程打开的文件

-a:列出打开文件存在的进程
-c<进程名>:列出指定进程所打开的文件
-g:列出GID号进程详情
-d<文件号>:列出占用该文件号的进程
+d<目录>:列出目录下被打开的文件
+D<目录>:递归列出目录下被打开的文件
-n<目录>:列出使用NFS的文件
-i<条件>:列出符合条件的进程(4、6、协议、:端口、 @ip )
-p<进程号>:列出指定进程号所打开的文件
-u:列出UID号进程详情
-h:显示帮助信息
-v:显示版本信息。
-n: 不反向解析网络名字
#查看指定用户打开的文件
lsof -u root | more
#查看指定目录下被打开的文件,参数+D为递归列出目录下被打开的文件,参数+d为列出目录下被打开的文件
lsof +D /var/log/
lsof +d /var/log/
#查看所有网络连接,通过参数-i查看网络连接的情况,包括连接的ip、端口等以及一些服务的连接情况,例
如:sshd等。也可以通过指定ip查看该ip的网络连接情况
lsof -i –n
lsof -i@127.0.0.1
#查看端口连接情况,通过参数-i:端口可以查看端口的占用情况,-i参数还有查看协议,ip的连接情况等
lsof -i :80 -n
#查看指定进程打开的网络连接,参数-i、-a、-p等,-i查看网络连接情况,-a查看存在的进程,-p指定进

lsof -i –n -a -p 9527
#查看指定状态的网络连接,-n:no host names, -P:no port names,-i TCP指定协议,-s指定协议
状态通过多个参数可以清晰的查看网络连接情况、协议连接情况等
lsof -n -P -i TCP -s TCP:ESTABLISHED

利用lsof恢复正在使用中的误删除文件
lsof |grep /var/log/messages
rm -f /var/log/messages
lsof |grep /var/log/messages
cat /proc/653/fd/6
cat /proc/653/fd/6 > /var/log/messages

51、进程管理和性能相关工具_&_21

51、进程管理和性能相关工具_pstree_22

51、进程管理和性能相关工具_pstree_23

51、进程管理和性能相关工具_&_24

信号管理kill

显示当前信号 kill -l   或者 trap -l

常用信号
1) SIGHUP 无须关闭进程而让其重读配置文件
2) SIGINT 中止正在运行的进程;相当于Ctrl+c
3) SIGQUIT 相当于ctrl+\
9) SIGKILL 强制杀死正在运行的进程
15) SIGTERM 终止正在运行的进程,默认信号
18) SIGCONT 继续运行
19) SIGSTOP 后台休眠

指定信号的方法 :
信号的数字标识:1, 2, 9
信号完整名称:SIGHUP,sighup
信号的简写名称:HUP,hup

kill -1 pid …
kill -n 9 pid
kill -s SIGINT pid

51、进程管理和性能相关工具_&_25

51、进程管理和性能相关工具_进程管理_26

killall  pkill

killall [-SIGNAL] comm…
pkill [options] pattern
-SIGNAL
-u uid: effective user,生效者
-U uid: real user,真正发起运行命令者
-t terminal: 与指定终端相关的进程
-l: 显示进程名(pgrep可用)
-a: 显示完整格式的进程名(pgrep可用)
-P pid: 显示指定进程的子进程

killall -o cmd 健康性检查,执行结果变量为0为健康,注此方式有局限性,即使进程处于停止或僵尸状态,此方式仍然认为是进程是健康的
[root@centos8 ~]#killall -0 ping
[root@centos8 ~]#echo $?
0
作业管理jobs

前台作业:通过终端启动,且启动后一直占据终端

后台作业:可通过终端启动,但启动后即转入后台运行(释放终端)

注:jobs需要到执行的作业的终端才能查询到

让作业运行于后台
运行中的作业: Ctrl+z
尚未启动的作业: COMMAND &

后台作业虽然被送往后台运行,但其依然与终端相关;退出终端,将关闭后台作业。如果希望送往后台
后,剥离与终端的关系
nohup COMMAND &>/dev/null &
screen;COMMAND
tmux;
fg [[%]JOB_NUM]:把指定的后台作业调回前台
bg [[%]JOB_NUM]:让送往后台的作业在后台继续运行
kill [%JOB_NUM]: 终止指定的作业

51、进程管理和性能相关工具_ps_27

51、进程管理和性能相关工具_&_28

并行管理

利用后台执行,实现并行功能,即同时运行多个进程,提高效率

方法一
f1.sh&
f2.sh&
f3.sh&
方法二
(f1.sh&);(f2.sh&);(f3.sh&)
方法三
f1.sh&f2.sh&f3.sh&
并行作业执行
NET=10.0.0
for i in {1..254};do
{
ping -c1 -W1 ${NET}.${i} &> /dev/null && echo ${NET}.${i} is up || echo ${NET}.${i} is down
}&
done
wait

51、进程管理和性能相关工具_&_29

51、进程管理和性能相关工具_ps_30