先上图,看一下HotSpot虚拟机中的垃圾收集器
图中包含了7中作用于不同分代的收集器,如果两个收集器之间存在连线,就说明它们可以搭配使用。接下来就一一介绍。
1.Serial 收集器
这个收集器是一个单线程的收集器,但它“单线程”的意义并不仅仅是它只会使用一个CPU或者一条线程去完成垃圾收集工作,更重要的是它在进行垃圾收集时,必须暂停其他所有的工作线程,直到它收集结束。即“Stop The World”,它由虚拟机在后台自动发起并完成,其运行示意图如下:
当然这个收集器缺点很明显,在GC的时候会影响体验,但它依然是虚拟机运行在client模式下的默认新生代收集器。它有着优于其他收集器的地方:简单而高效,对于限定单个CPU的环境来说,Serial收集器由于没有线程交互的开销,专心做垃圾收集自然可以获得最高的单线程收集效率。
2.ParNew收集器
ParNew收集器其实就是Serial收集器的多线程版本,除了使用多条线程进行垃圾收集之外,其余行为包括Serial收集器可用的所有控制参数、收集算法、Stop The World、对象分配规则、回收策略等都与Serial收集器完全一样。虽然创新不大,但它却是许多运行在Server模式下的虚拟机中首选的新生代收集器,其中一个与性能无关的原因就是除了Serial收集器外,目前只有它能与CMS收集器配合工作。其工作过程如下:
ParNew收集器在单CPU的环境中绝对不会有比Serial收集器更好的效果,甚至由于存在线程交互的开销,该收集器在通过超线程技术实现的两个CPU的环境中都不能百分百保证可以超越Serial收集器。当然随着CPU数量增加,其优势就会很明显,默认开启的收集线程数与CPU的数量相同,可以使用-XX:ParallelGCThreads参数来限制垃圾收集的线程数。
3.Parallel Scavenge 收集器
它是一个新生代收集器,使用复制算法、且是并行的多线程收集器。它的特点就是它与其他的收集器关注点不一样,CMS等收集器目标是尽可能地缩短垃圾收集时用户线程的停顿时间,而Parallel Scavenge收集器的目标则是达到一个可控制的吞吐量。吞吐量就是CPU用于运行用户代码的时间与CPU总消耗时间的比值,即吞吐量=运行用户代码时间 /(运行用户代码时间 + 垃圾收集时间)。
停顿时间短,对于用户的体验有较大提升,而高吞吐量则可以高效地利用CPU时间,尽快完成程序的运算任务,主要适合在后台运算而不需要太多交互的任务。
Parallel Scavenge收集器提供了两个参数用于精确控制吞吐量,分别是控制最大垃圾收集停顿时间的 -XX:MaxGCPauseMillis参数以及直接设置吞吐量大小的 -XX: GCTimeRatio参数。MaxGCPauseMillis参数允许的值是一个大于0的毫秒数,收集器尽可能保证内存回收花费的时间不超过设定值。但是这个值也不是越小越好,因为既然时间段了,那么次数肯定就频繁了,而且新生代也会变小,这样才能保证时间少。所以吞吐量反而会减小,即两者不可兼得。GCTimeRatio是垃圾收集时间占总时间的比率,相当于吞吐量的倒数。
这个收集器还有一个参数 -XX:+UseAdaptiveSizePolicy,这是个开关参数,打开后就不需要手动指定新生代大小、Eden与Survivior区的比例、晋升老年代对象大小等细节参数了。这称为GC自适应的调节策略。
4.Serial Old 收集器
Serial Old是Serial收集器的老年代版本,也是一个单线程收集器,使用“标记—整理”算法,这个收集器的主要意义也是在于给Client模式下的虚拟机使用。其运行示意图如下:
5.Parallel Old 收集器
它是Parallel Scavenge收集器的老年代版本,使用多线程和“标记—整理”算法,这个收集器是在JDK1.6中才开始提供的。在此之前,Parallel Scavenge收集器一直较尴尬,因为如果新生代选择了Parallel Scavenge收集器,那么老年代除了Serial Old收集器之外别无选择(它无法与CMS配合工作)。这样就会因Serial Old收集器拖累服务端性能,而Parallel Scavenge也就不能获得最大吞吐量。所以Parallel Old出现后,“吞吐量优先”收集器有了比较名副其实的应应用组合,在注重吞吐量以及CPU资源敏感的场合,都可以优先考虑Parallel Scavenge加Parallel Old收集器。其工作过程如下:
6.CMS 收集器
CMS收集器时一种以最短回收停顿时间为目标的收集器,因此适合一些重视响应速度的服务器上。CMS(Concurrent Mark Sweep)是基于**标记—清除”**算法实现的,它的运行过程比较复杂,整个过程分为4个步骤:
- 初始标记。标记一下GC Roots能直接关联到的对象,速度很快。需要Stop The World
- 并发标记。进行GC Roots Tracing。
- 重新标记。为了修正并发标记期间因用户程序继续运作而导致标记产生变动的那一部分对象的标记记录,这个阶段的停顿时间一般会比初始标记阶段稍长一些,但远比并发标记的时间短。需要Stop The World
- 并发清除。
整个过程中耗时最长的是并发标记和并发清除,但是这两个过程中收集器线程都可以与用户线程一起工作,所以从整体上来说,CMS收集器的内存回收过程是与用户线程一起并发执行的。其运行过程如图所示:
但CMS也有一些明显的缺点:
- CMS收集器对CPU资源非常敏感。根本原因还是因为它在并发标记或者并发清理的时候是和用户线程同步的,占用了部分CPU资源。CMS默认启动的回收线程数量是(CPU数量+3)/ 4,也就是说CPU在4个以上时,并发回收垃圾时收集线程不少于25%的CPU资源,且随着CPU数量增多而下降。但CPU不足4个时,它就会对用户程序影响变大。虽然后来虚拟机提供了一种称为“增量式并发收集器”,其实就是在并发阶段不让它并发,而是两种线程抢占CPU来交替运行,但是并没有用。
- CMS收集器无法处理浮动垃圾,可能出现“Concurrent Mode Failure”失败而导致另一次Full GC的产生。原因也是并发导致的,并发时用户线程会产生新的垃圾,而这些垃圾是在标记之前的(没有被标记),导致此过程中清理线程无法清理这些新出现的垃圾。由于在垃圾收集阶段用户线程还需要运行,那也就还需要预留有足够的内存空间给用户线程使用,因此CMS收集器不能像其他收集器那样等到老年代几乎完全被填满了再进行收集,需要预留一部分空间提供并发收集时的用户程序运作使用。CMS收集器的启动阈值为92%(参数为-XX:CMSInitiatingOccupancyFraction),也就是老年代如果已经用了92%,那么就会激活CMS收集器,若CMS运行期间预留的内存无法满足用户程序的需要,就会出现一次“Concurrent Mode Failure”失败,这时虚拟机将启动后备远:临时启用Serial Old收集器重新进行老年代的垃圾收集。所以参数CMSInitiatingOccupancyFraction不能设置过大。
- 因为CMS是一款基于“标记—清除”算法实现的,也就意味着收集结束时会有大量空间碎片产生。所以可能会出现收集完老年代有很大空间剩余,但无法找到足够大的连续空间分配大对象,不得不提前触发一次Full GC。所以CMS收集器提供了一个参数-XX:+UserCMSCompactAtFullCollection开关参数(默认开启),用户在CMS收集器顶不住要进行FullGC时开启内存碎片的合并整理过程,内存整理的过程是无法并发的,这个过程清除了碎片,但也使停顿时间变长,因而又提供了另一个参数-XX:CMSFullGCsBeforeCompaction,它用于设置执行多少次不压缩整理的Full GC后,跟着来一次带压缩整理的Full GC(默认值为0,即每次进入Full GC都进行碎片整理)。
7.G1 收集器
这是比较前沿和先进的收集器,是一款面向服务端应用的垃圾收集器。具备如下特点:
- 并行与并发:G1收集器可通过并发的方式让Java程序继续执行,而不需要停顿其他Java线程。
- 分代收集:分代概念在G1中依然保留,虽然G1可以不需要其他收集器配合就能独立管理整个GC堆,但它能够采用不同的方式去处理新创建的对象和已经存活了一段时间、熬过多次GC的就对象以获取更好的收集效果。
- 空间整合:与CMS的“标记—清理”算法不同,G1从整体看是基于“标记—清理”算法实现的收集器,从局部(两个Region)来看是基于“复制”算法实现的。但无论如何,这两种算法都意味着G1运行期间不会产生内存空间碎片,收集后能提供规整的可用内存。这样能拖延因分配大对象可能导致Full GC的时间。
- 可预测的停顿:降低停顿时间是G1和CMS共同的关注点,但G1除了追求停顿外,还能建立可预测的停顿时间模型,能让使用者明确指定在一个长度为M毫秒的时间片段内,消耗在垃圾收集上的时间不得超过N毫秒。
除G1的其他收集器都是针对整个新生代或者老年代来进行收集的,而G1不是。使用G1时,它将整个Java堆划分为多个大小相等的独立区域(Region),虽然还保留了新生代、老年代的概念,但这两者不再是物理隔离,都是一部分Region的集合。
G1之所以能建立可预测的停顿时间模型,是因为它可以有计划地避免在整个Java堆中进行全区域的垃圾收集。G1跟踪各个Region里面的垃圾堆积的价值大小(回收所获得的空间大小以及回收所需时间的经验值),在后台维护一个优先列表,每次根据允许的收集时间,优先回收价值最大的Region(这也就是Garbage-First名称的由来)。这种使用Region划分内存空间以及有优先级的区域回收方式,保证了G1收集器在有限时间内可以获取尽可能高的收集效率。
当然看似简单的逻辑背后却是很复杂的实现,因为虽然看起来分块收集很容易,但是要知道Region不可能是孤立的。一个对象即使分配在某个Region中,但并非只被本Region中的其他对象引用,而是可以与整个Java堆任意的对象发生引用关系。这样就会导致在做可达性分析判断对象存活时,需要扫描整个Java堆。同样分代收集也会有这样的问题,加入老年代有对象引用了新生代中对象,那回收新生代时也可能需要扫描老年代。
在G1收集器中,Region之间的对象引用以及其他收集器中老年代与新生代之间的对象引用,虚拟机都是使用Rememberd Set来避免全堆扫描的。G1中每个Region都有一个与之对应的Rememberd Set,虚拟机发现程序在对Reference类型的数据进行写操作时,会产生一个Write Barrier暂时中断写操作,检查Reference引用的对象是否处于不同的Region之中(分代收集时则是检查老年代中的对象是否引用了新生代中的对象),如果是,便通过CardTable把相关引用信息记录到被引用对象所属的Region的Rememberd Set之中。当进行内存回收时,在GC根节点的枚举范围内加入Rememberd Set即可保证不会对全堆扫描也不会有遗漏。
G1收集器的运作大致可分为以下几个步骤。
- 初始标记:仅仅标记一下GC Roots能直接关联到的对象,并修改TAMS(Next Top Mark Start)的值,让下一阶段用户程序并发运行时,能在正确可用的Region中创建新对象,这阶段需要停顿线程,但耗时很短。
- 并发标记:从GC Root开始对堆中对象进行可达性分析,找出存活的对象,此阶段耗时较长,但可与用户程序并发执行。
- 最终标记:为了修正在并发标记期间因用户程序继续运作而导致的标记产生变动的那一部分标记记录,虚拟机将这段时间对象变化记录在Rememberd Set Logs中,最终标记阶段需要把Remed Set Logs的数据合并到Rememberd Set中,这阶段需要停顿线程,但是可并行执行。
- 筛选回收:首先对各个Region的回收价值和成本进行排序,根据用户所期望的GC停顿时间来制定回收计划。