目录

一、cpu使用率彪高排查步骤

1.使用top命令

2.保存线程状态

3.找到进程中对应的线程

4.转换进制

5.查看保存线程状态的文件

二、top命令详解

1.top命令

2.每一行的具体解释

3.top的操作

高亮显示当前运行进程

进程字段排序

显示完整命令

显示指定的进程信息

 退出top

top交互命令


一、cpu使用率彪高排查步骤

1.使用top命令

使用top命令找到占用cpu较高的进程 ,top命令查看进程的一些基本信息,如下:

java这个进程占用cpu时间为100%,进程号为8379,PID就是进程id

systemd cpu 某时候会占用 高_服务器

按q键(或者ctrl+c)退出top命令。

2.保存线程状态

用jstack命令保存进程中的线程状态到文件中;jstack是java虚拟机自带的一种堆栈跟踪工具。

jstack 进程号 > 文件名.txt (把进程对应的线程状态信息输入show1.txt文件中,方便我们观察)

systemd cpu 某时候会占用 高_运维_02

3.找到进程中对应的线程

top -p 8379(进程id) -H  (-H代表设置线程模式)

用top -H -p pid(top -p pid -H)(top -Hp pid)(顺序都可以)命令查看该进程内各个线程占用的CPU百分比

systemd cpu 某时候会占用 高_运维_03

如下,找到8379进程下面的线程8416占用cpu特别高

systemd cpu 某时候会占用 高_服务器_04

CTRL+C结束命令。

4.转换进制

因为使用jstack保存进程中的线程状态时,线程id是16进制保存的,所以这里要把线程id转为16进制,提供两种方法,第一种,使用printf函数转换,如下:printf "%x" 8416 转为16进制为20e0

systemd cpu 某时候会占用 高_运维_05

或者使用计算器转换如下:

systemd cpu 某时候会占用 高_运维_06

5.查看保存线程状态的文件

这里使用的是less命令,实际上自己喜欢用哪种命令都行,如more、cat等

 

systemd cpu 某时候会占用 高_linux_07

 show1.txt文件内容如下:

systemd cpu 某时候会占用 高_top命令_08

 搜索20e0(ctrl+冒号 然后输入斜杠 再复制16进制的线程号 再回车 即可搜索这个线程所在的位置)

即->   :/20e0 回车

搜索结果如下:这个线程的状态是runnable(运行状态),对应的位置为Test1.java 12行

systemd cpu 某时候会占用 高_服务器_09

 找到这一行的代码如下:

systemd cpu 某时候会占用 高_线程状态_10

发现是一个无线循环,所以导致了cpu彪高。

至此。

二、top命令详解

1.top命令

输入top如下:

把下面的结果分为上下两块来看 

systemd cpu 某时候会占用 高_运维_11

2.每一行的具体解释

前五行是当前系统情况整体的统计信息区。下面我们看每一行信息的具体意义。

systemd cpu 某时候会占用 高_top命令_12

第一行,任务队列信息,同 uptime 命令的执行结果,具体参数说明情况如下

top - 23:36:23 up 80 days,  2:00,  4 users,  load average: 0.03, 0.18, 0.44
23:36:23 当前系统时间
up 80 days距离上次服务器重启服务器已经运行了80天
4 users当前有4个用户登录系统
load average: 0.03, 0.18, 0.44 load average后面的三个数分别是1分钟、5分钟、15分钟的负载情况
load average数据是每隔5秒钟检查一次活跃的进程数,然后按特定算法计算出的数值。如果这个数除以逻辑CPU的数量,结果高于5的时候就表明系统在超负荷运转了。


第二行,Tasks — 任务(进程),具体信息说明如下

Tasks: 181 total,   1 running, 180 sleeping,   0 stopped,   0 zombie

系统现在共有181个进程,其中处于运行中的有1个,180个在休眠(sleep),stoped状态的有0个,zombie状态(僵尸)的有0个。
 

第三行,cpu状态信息,具体属性说明如下

%Cpu(s):  2.3 us,  3.1 sy,  0.0 ni, 94.6 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
1
2.3% us — "user CPU time"  用户空间占用CPU的百分比。
3.1% sy — "system CPU time" 内核空间占用CPU的百分比。
0.0% ni — nice CPU time 改变过优先级的进程占用CPU的百分比
94.6% id — idle 空闲CPU百分比
0.0% wa — iowait IO等待占用CPU的百分比(等待输入输出的CPU时间百分比)
0.0% hi — hardware irq 硬中断(Hardware IRQ)占用CPU的百分比
0.2% si — software irq 软中断(Software Interrupts)占用CPU的百分比
0.0% st - steal time 表示被强制等待虚拟CPU的时间

第四行,内存状态,具体信息如下

KiB Mem : 16265536 total,   807520 free, 12503980 used,  2954036 buff/cache

16265536k total — 物理内存总量(16GB)
807520k free — 空闲内存总量(807MB)
12503980k used — 使用中的内存总量(12GB)
2954036k buffers — 缓存的内存量 (2GB)

第五行,swap交换分区信息,具体信息说明如下

KiB Swap:        0 total,        0 free,        0 used.  2625804 avail Mem 
0k total — 交换区总量(0)
0k free — 空闲交换区总量(0)
0k used — 使用的交换区总量(0)
2625804 avail Mem 虚拟内存总量(2.6GB)
buff/cache虽然占用物理内存,但当内存不够时也可以直接使用,因此物理内存的可使用空间为:free + buff/cache。

第六行,空行。

第七行以下:各进程(任务)的状态监控,项目列信息说明如下

PID — 进程id
USER — 进程所有者
PR — 进程优先级
NI — nice值。负值表示高优先级,正值表示低优先级
VIRT — 进程使用的虚拟内存总量,单位kb。VIRT=SWAP+RES
RES — 进程使用的、未被换出的物理内存大小,单位kb。RES=CODE+DATA
SHR — 共享内存大小,单位kb
S —进程状态。D=不可中断的睡眠状态 R=运行 S=睡眠 T=跟踪/停止 Z=僵尸进程
%CPU — 上次更新到现在的CPU时间占用百分比
%MEM — 进程使用的物理内存百分比
TIME+ — 进程使用的CPU时间总计,单位1/100秒
COMMAND — 进程名称(命令名/命令行)

3.top的操作

top基本视图中,按键盘数字“1”,可监控每个逻辑CPU的状况 ,如下,按1后可以看到cpu0-3,我这台机器只有4核心

systemd cpu 某时候会占用 高_服务器_13

高亮显示当前运行进程

敲击键盘“b”(打开/关闭加亮效果),top的视图变化如下


进程id为22221的“top”进程被加亮了,top进程就是视图第二行显示的唯一的运行态(runing)的那个进程,可以通过敲击“y”键关闭或打开运行态进程的加亮效果。

systemd cpu 某时候会占用 高_线程状态_14

进程字段排序

top默认的排序列是%CPU 敲击键盘“x”(打开/关闭排序列的加亮效果),top的视图变化如下

systemd cpu 某时候会占用 高_服务器_15

显示完整命令

top -c或者先输入top进入后按c

systemd cpu 某时候会占用 高_服务器_16

显示指定的进程信息

top -p 123

 退出top

q可以退出top

top交互命令

在top 命令执行过程中可以使用的一些交互命令。这些命令都是单字母的,如果在命令行中使用了s 选项, 其中一些命令可能会被屏蔽。

h 显示帮助画面,给出一些简短的命令总结说明
k 终止一个进程。
i 忽略闲置和僵死进程。这是一个开关式命令。
q 退出程序
r 重新安排一个进程的优先级别
S 切换到累计模式
s 改变两次刷新之间的延迟时间(单位为s),如果有小数,就换算成m s。输入0值则系统将不断刷新,默认值是5 s
f或者F 从当前显示中添加或者删除项目
o或者O 改变显示项目的顺序
l 切换显示平均负载和启动时间信息
m 切换显示内存信息
t 切换显示进程和CPU状态信息
c 切换显示命令名称和完整命令行
M 根据驻留内存大小进行排序
P 根据CPU使用百分比大小进行排序
T 根据时间/累计时间进行排序
W 将当前设置写入~/.toprc文件中

-h | -v: 显示帮助或者版本信息】
** -c:** 命令行列显示程序名以及参数
-d: 启动时设置刷新时间间隔
-H: 设置线程模式
-i: 只显示活跃进程
-n: 显示指定数量的进程
-p: 显示指定PID的进程
-u: 显示指定用户的进程