用jstack排查
- 先执行top,找到CPU占用比较高的进程
- jstack 进程id > show.txt
- 找到进程中CPU占用比较高的线程,线程id转为16进制
- 到show.txt文件中根据线程id查看线程的具体状态即可
用Arthas
Top命令使用
top 命令运行图:
第一行:基本信息
第二行:任务信息
第三行:CPU使用情况
第四行:物理内存使用情况
buff/cache:
buffers 和 cache 都是内存中存放的数据,不同的是,buffers 存放的是准备写入磁盘的数据,而 cache 存放的是从磁盘中读取的数据
在Linux系统中,有一个守护进程(daemon)会定期把buffers中的数据写入的磁盘,也可以使用 sync 命令手动把buffers中的数据写入磁盘。使用buffers可以把分散的 I/O 操作集中起来,减少了磁盘寻道的时间和磁盘碎片。
cache是Linux把读取频率高的数据,放到内存中,减少I/O。Linux中cache没有固定大小,根据使用情况自动增加或删除。
演示死循环死锁
死循环
这里我只介绍一下用到的top参数
先手动制造CPU飙高的场景,多执行几次,小编这里执行3次
先执行top
看到pid为23757的进程CPU占用较高,执行如下命令
看看线程的具体情况
当然你也可以使用交互命令
然后再输入H,效果和上面一样
可以看到PID为23772,23773和23774的线程占用CPU较高
这里可能有人有疑惑,为什么线程也有PID啊?其实线程进程都会有自己的ID,这个ID就叫做PID,PID是不特指进程ID,线程ID也可以叫做PID
将10进制的23772转为16进制,因为jstack中PID用的是16进制
打开loop.txt文件,搜5cdc
可以看到线程状态为RUNNABLE,一直在执行ShowTopController中的第23行,即
好了定位到代码中的位置了,当然生产环境中肯定不会写一个死循环的,有可能在特殊场景下出现死循环,或执行一个方法特别慢,用这种方法很快就能找到代码位置。
死锁
接着访问
执行
打开loop.txt文件到最后
看到发现一个死锁,死锁代码的位置描述的很清楚,生产环境发生的死锁当然没有这么简单,所有学会用这些命令排查还是很有必要的
参考博客
top命令
[1]https://linux.cn/article-2352-1.html
[2]https://www.jianshu.com/p/7ecdb31f783f
3]http://os.51cto.com/art/201108/285581.htm