1 GC算法简介

算法

特点

标记-清除

分为“标记”和“清除”两个阶段

复制

可以解决效率问题,将可用的内存按容量划分为大小相等的两块。

标记-整理

先标记、再整理,最后清理

分代收集

划分新生代和老年代

2 标记-清除

2.1 流程

分为“标记”和“清除”两个阶段:
(1)首先标记出所需要回收的对象(引用计数法和可达性分析,两次标记过程);
(2)在标记完成后统一回收所有被标记的对象。

2.2 缺点

(1)效率问题:标记和清除两个过程的效率不高;
(2)空间问题:标记清除后会产生大量不连续的内存碎片,导致以后在程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。

3 复制

3.1 流程

可以解决效率问题,将可用的内存按容量划分为大小相等的两块
(1)每次只使用其中的一块;
(2)当这一块用完了,就将还存活的对象复制到另一块上;
(3)然后再把已使用的内存空间清理掉。

3.2 优点

  每次对整个半区进行内存回收,避免内存碎片问题,只需移动堆顶指针,按顺序分配内存即可,实现简单,运行高效。

3.3 缺点

  将内存缩小为原来的一半,代价高;当对象存活率较高时需要进行较多的复制操作,效率降低。

3.4 应用

  回收新生代,新生代中分为Eden空间和两块较小的Survivor空间,每次使用Eden和其中的一块Survivor。默认Eden:Survivor=8:1,Survivor不够时,老年代内存分配担保。

4 标记-整理

4.1 流程

(1)首先标记处所需要回收的对象;
(2)不直接对可回收对象进行清理,让所有存活的对象都向一端移动
(3)直接清理掉端边界以外的内存。

4.2 优点

  改进了复制算法在对象存活率较高时带来的效率问题;

4.3 应用

  老年代收集(对象存活率较高)

5 分代收集

5.1 思想

  根据对象存活周期的不同将内存划分为新生代和老年代,根据各自的特点采用合适的收集算法。
(1)新生代中,每次垃圾收集时都发现有大批对象死去,少量存活,选用复制算法;
(2)老年代中,对象存活率高、没有额外空间进行分配担保,使用“标记-清理”或者“标记-整理”。

6 QA

6.1 为什么不是1块Survivor空间而是2块?

  这里涉及到一个新生代和老年代的存活周期的问题,比如一个对象在新生代经历15次GC回收,就可以移到老年代了。问题来了,当我们第一次GC的时候,我们可以把Eden区的存活对象放到Survivor-1空间,但是第二次GC的时候,Survivor-1空间和Eden区的存活对象也需要再次用复制算法,放到Survivor-2空间上,而把刚刚的Survivor-1空间和Eden空间清除。第三次GC时,又把Survivor-2空间和Eden区的存活对象复制到Survivor-1空间,如此反复。
  所以,这里就需要2块Survivor空间来回倒腾。

6.2 为什么Eden空间这么大而Survivor空间要分的少一点?

  1. 新创建的对象都是放在Eden空间,这是很频繁的,尤其是大量的局部变量产生的临时对象,这些对象绝大部分都应该马上被回收,能存活下来被转移到survivor空间一般不是很多。所以,设置较大的Eden空间和较小的Survivor空间是合理的,大大提高了内存的使用率,缓解了复制算法的缺点。
  2. 8:1:1这种比例就挺好的,当然这个比例是可以调整的,包括上面的新生代和老年代的1:2的比例也是可以调整的。
  3. 新的问题又来了,从Eden空间往Survivor空间转移的时候,如果出现Survivor空间不够了怎么办?直接放到老年代去。 有的对象来回在Survivor-1区或者Survivor-2区呆了比如15次,就被分配到老年代Old区;有的对象太大,超过了Eden区,直接被分配在Old区;有的存活对象,放不下Survivor区,也被分配到Old区。如果老年代Old区也被放满了,就是一次大GC即为Major GC。