Java线上内存溢出问题排查步骤



1、使用top对当前服务器内存有个大致了解,top后 shift+M俺内存占用由大到小排序



2、利用ps命令查看服务pid:ps -aux|grep java



3、利用jstat查看虚拟机gc情况



jstat  -gc:util <vmid>  [<interval> [<count>]
vmid:虚拟机进程号
interval:采样时间,默认单位是ms
count:采样条数





[root@speedyao java]# jstat -gcutil 17561 1000 10



 以上命令代表1秒钟采样1次,总共采样10次。



如果FULL GC明显大于YOUNG GC次数,并且FULL GC次数很频繁,说明程序有大内存对象,并且一直无法释放。



4、生成dump文件,有两种方式。 一种是利用jmap直接生成dump文件;另一种是利用gcore先生成core文件,再根据core文件利用jmap生成dump文件。



(1)先说第一种,这种比较简单,使用这种方案的时候请注意:JVM会将整个heap的信息dump写入到一个文件,heap如果比较大的话,就会导致这个过程比较耗时,并且执行的过程中为了保证dump的信息是可靠的,所以会暂停应用。



[root@speedyao java]# jmap -dump:format=b,file=heap.prof  17561



format=b:表示生成二进制类型的dump文件
file=:后面写的是输出的dump文件路径
17561:jvm进程id



(2)接下来是第二种。这一种在jmap转换core文件的时候比较耗时,并且生成的dump文件用mat打开的时候分析结果不太正确,不太好定位问题。所以我建议使用第一种,虽然会造成服务挂起吧,但是结果总归是正确的。



优势:利用gcore保存服务的内存信息,因为gcore比jmap的dump会快很多,也不对线上服务有大的影响。



利用jmap将gcore文件转换为java的dump文件,这一步执行的比较慢,可以用nohup执行,以防止误点Ctrl+C导致退出。5、利用MAT或者 jdk自带的jvisualvm.exe 来分析dump文件



在MAT工具中一般用到比较多的2个功能1、Histogram2、Leak Suspects



Histogram



这个功能主要是查看类和对象关系,对象和对象之间的关系,用来定位哪些对象在FGC之后还活着,哪些对象占大部分内存。



Leak Suspects

Leak Suspects 界面提示可能存在内存的泄露。有的时候具体代码的位置都帮我们定位好了,排查非常方便。



JVM加上 -XX:+HeapDumpOnOutOfMemoryError 这个参数,系统 oom的时候会自动dump的,到时候拿快照MAT中分析即可。