• "

JVM 的定位系统问题时,知识和经验是关键基础,数据是依据、工具是运用知识处理数据的手段

数据包括:运行日志、异常堆栈、GC日志、线程快照(thread dump、javacore文件)、堆转储快照(headdump / hprof 文件)

一、调优命令

JDK监控和故障处理命令,在bin目录下有:jps、 jstat、jmap、jhat、jstack、jinfo

  • jps:显示虚拟机进程,常用如:jps -l -v
  • jstat:收集虚拟机各方面的运行数据,常用如:jps-gcutil 2764jstat -gc 2764 250 20
  • jinfo:显示虚拟机配置信息
  • jmap:生成虚拟机内存转储快照(headdump 文件),常用如:jmap -dump:live,format=b,file=dump.hprof 28920
  • jhat:用于分析headdump 文件,他会建立一个http/html 的服务器,让客户可以在浏览器上查看分析结果,常用如:jhat dump.hprof
  • jstack: 显示虚拟机线程快照,常用如:jstack -l 11494

下面做一 一介绍

二、Jps

显示指定系统内所有的HotSpot虚拟机进程,

格式 :


jps - [hostid]


options 参数:


-q:只输出LVMID,省略主类的名称
  -m:输出新建启动时传递给主类main()函数的参数
  -l:输出主类的全名,如果进程执行的是Jar包,输出Jar路径
  -v:输出虚拟机进程启动时JVM参数


其中[option]、[hostid]参数也可以不写

一般使用:


jps -l -m


三、Jstat

用于监视虚拟机运行时状态信息的命令,它可以显示出虚拟机进程中的类装载、内存、垃圾收集、JIT编译等运行数据。

格式


jstat - [-t] [-h] [ []]


  • vmid: 进程号,interval 和count :表示查询间隔和次数
  • options 参数如下
-class:监视类装载、卸载熟练、总空间以及类装载所消耗的时间
-gc : 监视堆状况,包括Eden区、两个survivor区、老年代、永久代等容量、已用空间和GC 时间合计等信息
-gccapacity:监视内容和 -gc基本相同,但输出主要关注堆各个区域使用到最大,最小空间
-gcutil:监视内容和 -gc基本相同,但输出主要关注已使用空间占总空间的百分比
-gccause:与 -gcutil一样,额外输出导致上次GC产生的原因
-gcnew:监视新生代GC状况
-gcnewcapacity:监视内容和 -gcnew 基本相同,输出输出主要关注使用到的最大、最小空间
-gcold:监视老年代GC状况
-gcoldcapacity:监视内容和 -gcold 基本相同,输出输出主要关注使用到的最大、最小空间
-gcpermcapacity:输出永久代使用的最大、最小空间
-compiler:输出JIT 编译期编译过的方法、耗时等信息
-printcompilation:输出已经被JIT编译的方法


一般使用:

jps-gcutil 2764 //输出的是已使用空间占总空间的百分比
jstat -gc 2764 250 20 //每隔250ms输出2764的gc情况,一共输出20次

四、Jinfo

作用是实时查看和调整虚拟机运行参数。 之前的jps -v口令只能查看到显示指定的参数,如果想要查看未被显示指定的参数的值就要使用jinfo口令

格式


jinfo [option vmid]


vmid: 进程号

option参数


-flag : 输出指定args参数的值
-flags : 不需要args参数,输出所有JVM参数的值
-sysprops : 输出系统属性,等同于System.getProperties()


一般使用:jinfo -flag 11494

五、Jmap

用于生成heap dump文件,如果不使用这个命令,还阔以使用-XX:+HeapDumpOnOutOfMemoryError参数来让虚拟机出现OOM的时候·自动生成dump文件(阿里开发手册推荐)。说明:OOM 的发生是有概率的,甚至相隔数月才出现一例,出错时的堆内信息对解决问题非常有帮助。

jmap不仅能生成dump文件,还阔以查询finalize执行队列、Java堆和永久代的详细信息,如当前使用率、当前使用的是哪种收集器等。

格式


jmap - [vmid]


option 参数


-dump : 生成堆转储快照
-finalizerinfo : 显示在F-Queue队列等待Finalizer线程执行finalizer方法的对象
-heap : 显示Java堆详细信息
-histo : 显示堆中对象的统计信息
-permstat : to print permanent generation statistics
-F : 当-dump没有响应时,强制生成dump快照


一般使用 :

jmap -dump:live,format=b,file=dump.hprof 28920

dump堆到文件,format指定输出格式,live指明是活着的对象,file指定文件名

dump.hprof这个后缀是为了后续可以直接用MAT(Memory Anlysis Tool)打开。

六、Jhat

用来分析jmap生成的dump;与jmap搭配使用;jhat内置了一个微型的HTTP/HTML服务器,生成dump的分析结果后,可以在浏览器中查看。

在此要注意,一般不会直接在服务器上进行分析,因为jhat是一个耗时并且耗费硬件资源的过程,一般把服务器生成的dump文件复制到本地或其他机器上进行分析。

格式


jhat [dumpfile]


七、Jstack

用于生成java虚拟机当前时刻的线程快照。线程快照是当前java虚拟机内每一条线程正在执行的方法堆栈的集合,生成线程快照的主要目的是定位线程出现长时间停顿的原因,如线程间死锁、死循环、请求外部资源导致的长时间等待等。 如果java程序崩溃生成core文件,jstack工具可以用来获得core文件的java stack和native stack的信息,从而可以轻松地知道java程序是如何崩溃和在程序何处发生问题。另外,jstack工具还可以附属到正在运行的java程序中,看到当时运行的java程序的java stack和native stack的信息, 如果现在运行的java程序呈现hung的状态,jstack是非常有用的。

格式


jstack [option] LVMID


option参数


-F : 当正常输出请求不被响应时,强制输出线程堆栈
-l : 除堆栈外,显示关于锁的附加信息
-m : 如果调用到本地方法的话,可以显示C/C++的堆栈


一般使用:


jstack -l 11494


八、调优工具

1. jconsole

  • jdk /bin 目录下,单机jconsole.exe 启动启动
  • 自动搜索本机运行的所有虚拟机进程,不需要用户自己在使用jps 来查询

GChisto是一款专业分析gc日志的工具,可以通过gc日志来分析:Minor GC、full gc的时间、频率等等,通过列表、报表、图表等不同的形式来反应gc的情况。

GC Easy:推荐此工具进行gc分析;这是一个web工具,在线使用非常方便,进入官网,讲打包好的zip或者gz为后缀的压缩包上传,过一会就会拿到分析结果。

2. VisualVM

jdk 集成的分析工具,在jdk /bin 目录下,单机jvisualvm.exe 启动

3. Oracle Java Mission Control

jdk 集成的分析工具,在jdk /bin 目录下,单机jmc.exe 启动

九、常见问题分析

1. 查找CPU飙升的原因

问题分析步骤:

  • 首先,需要知道哪个进程占用CPU比较高,
  • 其次,需要知道占用CPU高的那个进程中的哪些线程占用CPU比较高,
  • 然后,需要知道这些线程的stack trace。

问题解决步骤:

①. top和pgrep来查看系统中Java进程的CPU占用情况。

  • 命令如下:top -p pgrep -d , java
  • pgrep:进程号,top -p:进程的信息。记录下CPU占用率最高的那个进程号。

②. top来查看进程中CPU占用最高的那些线程

  • top -Hp 12345
  • 假定12345为占用CPU高的进程号。-H是显示该进程中线程的CPU占用情况。同样,记录下CPU占用率高的那些线程号。

③. ctrl+H 切换到线程模式,找到占用cpu最高的线程。并把线程号转化为十六进制printf "%xn" <线程ID>

④. 通过jstack导出Java应用中线程的stack trace(堆栈轨迹)

  • jstack 12345

注意:因为top中显示的线程号是10进制,jstack的输出结果中的线程号是16进制,所以只需要把top中看到线程号转换成16进制

小结一下,我们通过top和jstack来找到CPU占用高的线程的stack trace,可以使用Eclipse Memory Analyzer插件分析

2. Java堆溢出和泄漏

①. 内存溢出

程序在申请内存时,没有足够的内存空间供其使用

危害:容易受攻击影响因素如下几大类:

  • 内存中加载的数据量过于庞大,如一次从数据库取出过多数据
  • 集合类中有对对象的引用,使用完后未清空,使得JVM不能回收
  • 代码中存在死循环或循环产生过多重复的对象实体

解决方案:

  • 修改JVM启动参数,直接增加内存
  • 检查错误日志,是否有其他异常或错误;
  • 对代码进行走查和分析,找出可能发生内存溢出的位置
  • 重点排查:数据库的取值,死循环和递归调用

②. 内存泄漏

无法释放已申请的内存空间

危害:频繁GC、运行崩溃
影响因素如下几大类:

  • 静态集合类引起内存泄露
  • 当集合里面的对象属性被修改后,再调用remove()方法时不起作用。
Set<Person> set = new HashSet<Person>();
Person p3 = new Person("唐僧","pwd1",25);
p3.setAge(2); //修改p3的年龄,此时p3元素对应的hashcode值发生改变
set.remove(p3); //此时remove不掉,造成内存泄漏


  • 监听器。释放对象时没有删除监听器。
  • 各种连接 ,比如数据库连接
  • 单例对象持有外部对象的引用

解决办法:使用工具jconsole分析

堆的最小值-Xms参数,最大值-Xmx参数


//代码实现堆溢出:---> 无限循环创建 对象
List list =new ArrayList();
int i=0;
while(true){
    list.add(new byte[5*1024*1024]);//----------->就是这一步
    System.out.println("分配次数:"+(++i))
}


③. Java栈溢出

栈溢出SOF定义:线程请求的栈深度超过虚拟机允许的最大深度

  • 无论是由于栈帧太大还是栈容量太小,当内存无法分配时都是OOM异常。
  • 虚拟机栈溢出:深度溢出:递归方法;广度溢出:大数组,建立多线程
//代码实现栈泄漏---> 方法无限递归调用
public void add(int i){
    add(i+1);
}