探索ParNew和CMS垃圾回收器

 

前言

上篇文章我们一起分析了JVM的垃圾回收机制,了解了新生代的内存模型,老年代的空间分配担保原则,并简单的介绍了几种垃圾回收器。详细内容小伙伴们可以去看一下我的上篇文章:秒懂JVM的垃圾回收机制

今天我们就来探索一下,ParNew和CMS垃圾回收器的实现过程。

 

ParNew垃圾回收器

现在,如果没有使用G1垃圾回收器,通常情况下大家都是用的ParNew作为新生代的垃圾回收器。

首先我们思考一个问题,假如我们的服务器CPU是4核的,如果对新生代垃圾回收的时候,仅仅使用单线程进行,是不是就会导致CPU的性能无法发挥?

所以ParNew垃圾回收器主打的就是多线程的垃圾回收机制,老版本的Serial垃圾回收器主打的是单线程垃圾回收,他们都是对新生代进行垃圾回收的,唯一的区别就是单线程和多线程的区别,垃圾回收的算法是一样的,都是复制回收算法,上篇文章已经详细做过介绍,本篇文章不在重复介绍。

那么如何指定垃圾回收器为ParNew呢?

很简单,只要使用“-XX:+UseParNewGC”选项,只要加入这个选项,JVM启动之后对新生代的垃圾回收就是使用的ParNew垃圾回收器了。

后边的过程,垃圾回收算法,以及升级到老年代条件就是上篇文章我们介绍的那样。

默认情况下,如果指定为ParNew垃圾回收器,它会给自己设置与CPU核心数相同的垃圾回收线程。

如果要自定义垃圾回收线程数,可以使用“-XX:ParallelGCThreads”参数即可,但一般不建议修改此参数。

 

CMS垃圾回收器

老年代我们一般使用CMS进行垃圾回收。它采用的是标记清理算法,其实也很简单,就是先标记出哪些对象是垃圾对象,然后把这些对象清理掉。

 

 

通过上图,我们会发现一个问题,这种算法会造成很多内存碎片,这种碎片是大小不一的,可能放不下一个对象,那么这块内存就被浪费掉了。

也可能因为内存碎片太多,导致内存利用率很低,从而频繁引发FULL GC。这就是CMS的一个缺点了。

 

那么当发生FULL GC后,可能会先引发“Stop the World”,然后再采用标记清除算法回收垃圾,这样会有什么问题?

之前我们介绍过,当发生“Stop the World”的时候,会停止一切工作线程,导致程序卡顿,所以CMS的垃圾回收方式其实不是这样的。

CMS采取的是垃圾回收线程和系统工作线程尽量同时执行的模式来处理垃圾回收的。

一共分为四个阶段:初始标记、并发标记、重新标记、并发清理。

我们一个一个来看。

 

首先CMS进行Full GC了,会先执行初始标记阶段,这个阶段会引发“Stop the World”状态,停止所有工作线程,然后标记出所有GC Roots直接引用的对象。

public class Main {
    private static SysUser1 sysUser1 = new SysUser1();
}
public class Main {
    private  SysUser2 sysUser2 = new SysUser2();
}

比如上边的代码,在这一阶段仅仅会标记出静态变量sysUser1这个对象,而不会去管sysUser2对象,因为它是实例变量引用的。

方法的局部变量和类的静态变量是GC Roots,但是类的实例变量不是GC Roots。

所以第一个阶段虽然会造成“Stop the World”,但是实际影响不大,因为仅仅标记了GC Roots直接引用的对象,不会耗时太久。、

 

接下来进入第二阶段,并发标记阶段,这个阶段系统进程可以随意创建新的对象,正常运行。

在这一阶段中,可能有新的对象创建,也可能有旧的对象变成垃圾对象,CMS会尽可能对已有对象进行GC Roots追踪,看看类似sysUser2这种对象被谁引用了。

如果它被间接的引用了,那么此时就不需要回收它。

简单的理解,第二阶段就是对老年代所以对象进行GC Roots追踪,这个还是很耗费时间的,但由于没有停止系统工作线程,所以不会对系统产生影响。

 

接着进入第三阶段,重新标记阶段。

因为第二阶段系统正常运行,所以结束后一定还会存在新的存活对象和垃圾对象是未被标记的。

所以在第三阶段将会再次触发“Stop the World”状态,停止系统工作线程。

然后重新标记在第二阶段中新创建的对象和新成为垃圾的对象。

这一过程是很快的,因为要标记的对象其实是很少的。

 

最后重新恢复系统工作进程,进入第四阶段:并发清理阶段。

这一阶段系统正常运行,然后CMS会对之前已经标记过的对象进行垃圾清理。

这一阶段也是很耗时的,但系统还在正常运行,是并发进行的。

 

CMS垃圾回收器存在的问题

通过上文的介绍,相信小伙伴们对于CMS的基本工作原理有了一个认识,大家会发现CMS本身已经对垃圾回收机制进行了性能的优化,那么为什么我们在jvm调优时要减少Full GC的频率呢?

其实CMS还是存在性能问题呢,比如上文我们说过的内存碎片问题。

 

cpu资源消耗问题

另外我们来思考一下,在并发标记阶段和并发清理阶段是最耗时的,与工作线程同时运行,是不是会导致CPU资源的占用?

所以这两个阶段是比较耗费CPU资源的。

CMS默认启动的垃圾回收线程数是(CPU核心数+3)/4。

那么假如我们使用的是一个2核的处理器,那么CMS就会占用(2+3)/4=1个垃圾回收线程。

所以CMS这个并发机制的第一个问题就是消耗CPU的资源

 

Concurrent Mode Failure问题

第二个问题是比较严重的问题,就是在并发清理阶段,CMS清理的其实是之前标记好的对象。

但是由于系统并发的运行着,所以可能会有新的对象进入老年代,同时变成垃圾对象,这种对象就是“浮动垃圾”。

 

因为他们虽然是垃圾对象,但没有被标记,所以不会被清理掉。

所以为了保证CMS垃圾回收期间,还有一定的内存空间让新对象进入老年代,一般会预留空间。

当老年代的内存占用达到一定的比例值了,就会触发Full GC。

“-XX:CMSInitiatingOccupancyFaction”参数可以设置这个比例值,jdk1.6里面默认的是92%。

也就是说老年代占用了92%的空间后,就会执行Full GC,预留8%空间给并发回收期间新进入老年代的对象。

那么如果说这个预留的空间不够了,会发生什么呢?

这个时候就会发生Concurrent Mode Failure,然后会自动使用“Serial Old”垃圾回收器替代CMS,强行执行“Stop the World”,重新进行GC Roots追踪,然后一次性回收掉垃圾对象后,再恢复系统工作进程。

这样一来系统卡死的时间可能就很长了。

所以实际生产环境中,这个自动触发GC的比例是可以合理优化一下的。但一般情况下都不需要优化。

 

内存碎片问题

内存碎片问题上文已经介绍过了,就是可能会频繁引发Full GC。

CMS有个参数“-XX:+UseCMSCompactAtFullCollection”,默认是打开的。

它的意思是在Full GC后要再次进行“Stop the World”,然后进行碎片整理工作。

还有一个参数“-XX:CMSFullGCsBeforeCompaction”,这个意思是执行多少次Full GC后再执行碎片整理,默认是0,意思是每次Full GC后进行碎片整理。

这两个参数一般情况下都不需要修改,因为本来我们就要减少Full GC的频率,在低频率下,每次进行碎片整理是没有问题的。

 

总结

今天我们对ParNew做了一个简单的介绍,其实就是并发机制。同时比较详细的介绍了CMS垃圾回收器的运行过程。

相信小伙伴们能够对它们有一个深刻的印象,那么新一代的G1垃圾回收器又是什么机制呢?

下篇文章我们就一起对G1垃圾回收器进行探索,不见不散。

 

往期文章推荐:

大白话谈JVM的类加载机制

JVM内存模型不再是秘密

轻松理解JVM的分代模型

秒懂JVM的垃圾回收机制

 

Tags: