案例现象
一般来讲,我们在 kill 掉一个进程的时候通常有两个选择:
- 找到进程的 pid 号,然后执行 kill 命令
- 找到进程的名字,然后执行 pkill 命令
pkill 和 kill 命令都是向指定的进程发送信号,从而完成终结进程的操作,主要区别在于 pkill 命令与 pgrep 配套使用,能够踢出指定终端用户、同时根据 UID 和用户名来终止进程
今天给大家分享一件我在使用 pkill 命令时遇到的比较有意思的事情
这台机器上(Cent OS7)运行着一个进程 after_sleep60s_output
执行 pkill 命令
然后当我使用 ps 命令查看的时候,我发现这个进程还在,而且返回了状态码 1
用 kill 命令试试,发现成功了
奇怪?为什么用 pkill 命令 kill 不掉这个进程?
定位问题
通过 man pkill
我发现,pkill 命令是默认结合 pgrep 来使用的
pgrep 首先找出目标进程(running),然后 pkill 再根据 pgrep 的结果来 kill 目标进程
pgrep 找目标进程是通过获取 /proc/[pid]/stat
只有15个字符
Linux 中的每一个进程都维护了一个 struct_task_struct
/usr/src/kernels/内核版本/include/linux/sched.h
里面
这里面有一个字段定义了不包括路径的可执行文件的名字,最大长度是 16 bytes,除去最后一个留给 null 的,就只有最多 15 个字符
然后我们看一下上面例子中进程对应的 stat 文件
可以看到文件里面的进程名字被截断成了15个字符:after_sleep60s_
如果要使用 pkill 命令,正确方式如下:
你也可以加一个 -f
参数
这个参数会告诉 pkill 不去/proc/[pid]/stat
/proc/[pid]/cmdline
里面找
这个文件里面包含了进程启动的时候的完整命令,包括参数
解决问题
想要准确的 kill 掉一个进程,可以使用下面的方法:
pidof
命令获取到进程对应的 PID,再使用kill
命令- 使用 systemd 启动的,通过
systemctl
命令来控制 - 使用 pkill 命令的时候建议加上
-f
参数