前言
三色标记算法,用于垃圾回收器升级,将STW变为并发标记。STW就是在标记垃圾的时候,必须暂停程序,而使用并发标记,就是程序一边运行,一边标记垃圾。
并发标记一共会有两个问题:一个是错标,标记过不是垃圾的,变成了垃圾(也叫浮动垃圾);第二个是本来已经当做垃圾了,但是又有新的引用指向它。
先看三色是什么
- 白色:没有检查(或者检查过了,确实没有引用指向它了)
- 灰色:自身被检查了,成员没被检查完(可以认为访问到了,但是正在被检查,就是图的遍历里那些在队列中的节点)
- 黑色:自身和成员都被检查完了
来看一下三色标记的过程
假设现在有白、灰、黑三个集合(表示当前对象的颜色),其遍历访问过程为:
- 初始时,所有对象都在 【白色集合】中;
- 将GC Roots 直接引用到的对象 挪到 【灰色集合】中;
- 从灰色集合中获取对象:
3.1. 将本对象 引用到的 其他对象 全部挪到 【灰色集合】中;
3.2. 将本对象 挪到 【黑色集合】里面。 - 重复步骤3,直至【灰色集合】为空时结束。
- 结束后,仍在【白色集合】的对象即为GC Roots 不可达,可以进行回收。
注:如果标记结束后对象仍为白色,意味着已经“找不到”该对象在哪了,不可能会再被重新引用。例如没有任何引用指向H了,它是白色,也不可能再有对象引用指向它了。
第一种问题: 错标
标记过不是垃圾的,变成了垃圾(也叫浮动垃圾),如下图:标记完了E是D的一个引用,也就是说此时E是灰色的,但是D断开的对E的引用。这个浮动垃圾的问题影响不是很大,可能就是暂时的浪费一点内存,它肯定抗不过下一轮GC。
第二种问题:漏标,或者叫错杀
这个问题是比较致命的,如果错杀了,就会出现运行结果不符合预期的情况。这个是绝对不能发生的。这发生的情况只有一个,就是D是黑色的,E是灰色的,但是D又指向了G,和E断开了指向G。 因为D已经标记了是黑色,但是E断开了引用,所以G就当做了是白色的。这个时候如果不操作的话,就会把G错杀掉。这种问题是必须解决掉的。
解决错杀的问题方法一G1的解决方法
上边描述过了,错杀的情况只有在 下边两个条件同时发生,才会发生
黑色对象指向了白色对象;
而本来指向这个白色对象的灰色对象断开了对它的连接。
所以我们针对以上的两个条件的任意一个条件做出应对,就可以把问题解决了。
G1是针对第一个条件做出了应对,就是写屏障和 SATB (Snapshot At The Beginning),因为D想要指向G,这是一个写操作。
当对象E的成员变量的引用发生变化时(objE.fieldG = null;
),我们可以利用写屏障,将E原来成员变量的引用对象G记录下来:
这种做法的思路是:尝试保留开始时的对象图,即原始快照(Snapshot At The Beginning,SATB),当某个时刻 的GC Roots确定后,当时的对象图就已经确定了。
比如 当时 D是引用着G的,那后续的标记也应该是按照这个时刻的对象图走(D引用着G)。如果期间发生变化,则可以记录起来,保证标记依然按照原本的视图来。
解决错杀的问题方法二 写屏障+ 增量更新
当对象D的成员变量的引用发生变化时(objD.fieldG = G;
),我们可以利用写屏障,将D新的成员变量引用对象G记录下来:
【当有新引用插入进来时,记录下新的引用对象】
这种做法的思路是:不要求保留原始快照,而是针对新增的引用,将其记录下来等待遍历,即增量更新(Incremental Update)。
解决错杀的问题方法三 读屏障
读屏障是直接针对第一步:var G = objE.fieldG;
,当读取成员变量时,一律记录下来:
这种做法是保守的,但也是安全的。因为条件二中【黑色对象 重新引用了 该白色对象】,重新引用的前提是:得获取到该白色对象,此时已经读屏障就发挥作用了。
三种昂不同的方式在垃圾回收器中的应用
- CMS:写屏障 + 增量更新
- G1:写屏障 + SATB
- ZGC:读屏障