3-JVM垃圾回收演算法和垃圾收集器

  • 2020 年 5 月 12 日
  • 筆記

垃圾回收演算法和垃圾收集器

1.什麼是垃圾回收

對於記憶體當中無用的對象進行回收,如何去判斷一個對象是不是無用的對象。

引用計數法:

每個對象中都會存儲一個引用計數,每增加一個引用就+1,消失一個引用就-1。當引用計數器為0時就會判斷該對象是垃圾,進行回收。

但是這樣會有一個弊端。就是當有兩個對象互相引用時,那麼這兩個對象的引用計數器都不為0,那麼就不會對其進行回收。

可達性分析:

判斷某個對象是否可到達。有兩種方式判斷是否可到達:

  1. 直接引用(上帝視角GC Roots):就是虛擬機棧幀中的局部或本地變數表、類載入器、static成員、常量引用、Thread等等中的引用直接到達。

    為什麼本地或局部變數表裡面的變數有它出發就可以用來判斷GC Roots的判斷標準呢?

    因為只用它表示這個棧幀正在被壓棧,正在被使用,這個時候再去回收這個對象不是瘋了嘛!!!同理static、常量也是一樣的道理。

  2. 間接引用:通過別人的引用來達到。

並發的可達性分析(並發標記、浮動垃圾)://mp.weixin.qq.com/s/EgVPlOLArsWb86Kujykn3A

2.垃圾回收的策略

垃圾收集演算法

  • 標記-清除

    先標記

    後清除

    弊端一:會有空間碎片問題,空間不連續;這時如果有大一點的對象進來,發現沒有連續的空間記憶體去進行分配,就會再一次的觸發垃圾回收機制。

    弊端二:在標記和清除的過程中、會掃描整個堆記憶體;會比較耗時。

    有點:簡單、明了、好操作。

  • 標記-複製

    一開始將這個記憶體空間一分為二,兩邊大小相等,一邊使用中的,一邊是保留區未使用的。劃分為這樣示例圖:

    在標記和清除之後,將存活的對象複製到另外一邊,在將先前的一邊數據全部清除掉。

    之後以此反覆、兩個循環往返。

    類似於堆記憶體中的新生代(Young)區中的Survivor區中的S0、S1,所以堆記憶體中的新生代(Young)區一定用的就是複製演算法。

  • 標記-整理

    先標記

    後整理。

    整理移動之後會得到一片連續的可分配記憶體空間。解決了空間碎片的問題,但是這種方式在標記和整理移動的過程中也是耗時的。


垃圾收集器:評判一個垃圾收集好壞和調優關注的是【高吞吐量、少停頓時間、少垃圾回收次數】

串列:Serial系列;

並行【吞吐量優先】:Paraller系列;

吞吐量:用戶程式碼執行的時間 / (用戶程式碼執行的時間+垃圾收集時間)99/(99+1)=99%。

適用於後台運算,不需要太多的交互場景。

並發【停頓時間優先】:CMS、G1;

​ 適用於用戶交互較多的場景,給用戶更好的體驗感;如Web應用。

JVM垃圾收集器調優的原則:儘可能在停頓時間較低的情況下,追求高的吞吐量和少的垃圾回收次數。

官方JVM垃圾收集器建議:

  1. 使用默認垃圾收集器
  2. 調整JVM堆的大小
    • 如果應用程式記憶體空間比較小(比如100MB),直接選擇SerialGC串列收集器。-XX:+UseSerialGC
    • 如果應用程式運行在一個單核的CPU,和沒有停頓時間要求的情況下;可以讓JVM自己去選擇或者選擇SerialGC串列收集器。-XX:+UseSerialGC
    • 如果應用程式更加關注的吞吐量也沒有停頓時間要求的情況下,可以讓JVM自己去選擇或者選擇並行的ParallelGC。-XX+UseParallelGC
    • 如果應用程式對停頓時間要求比較高(比如小於1秒鐘的時間),那麼就選擇CMS或者G1的收集器。-XX:+UseConcMarkSweepGC 或 -XX:+UseG1GC

G1(Garbage-First):JDK7出現,JDK8推薦使用,JDK9默認垃圾收集器。

G1的整個垃圾收集並清理的過程階段大體上和CMS收集器是不變的。在最後一個階段進行刪選回收(選擇性的回收,進行優先順序的回收:優先回收區域(Region)記憶體活對象較少的)。

重新設計記憶體空間如圖所示:

整個記憶體劃分為一個個大小相等的區域(Region)。邏輯上對這些區域(Region)進行標記,這些標記有Eden區,Survivor區和Old區。這時的物理空間上就不在是連續空間了;之前的空間劃分都是連續的空間。假如回收掉某個Old區的數據,這時這個區域也可能會標位Survivor區或者Eden區。

區域(Region)內還有一個記錄rememberd Set。以前會全盤掃描堆記憶體,是比較耗時的。這時會記錄一個對象存活的地方,對象的引用指向;這樣就不用在全盤掃描了耗時比較低。

官方文檔(G1垃圾收集器的前世今生)://www.oracle.com/technetwork/tutorials/tutorials-1876574.html


Young Generation(新生代)- 垃圾收集演算法一定是標記-複製演算法的實現

Serial:JDK1.3出現的,單執行緒收集,STW。那時候的CPU還是單核CPU。單執行緒處理效率比較高,在進行垃圾回收的時候,會暫停業務執行緒,等待垃圾回收完成之後,在讓業務執行緒再繼續執行。會搭配老年代的SerialOld配合使用。

這時會出現Stop The World(STW)


ParNew:並行垃圾收集器多個垃圾執行緒一起跑,STW ,停頓時間較多,更加關注吞吐量

複製演算法、並行多執行緒垃圾收集器,解決了單執行緒的局限性,但是還是Stop The World(STW)。


ParallelScavenge

同上


Tenured Generation(老年代)- 這裡是標記-清除、或標記-整理的演算法實現

CMS:JDK5出現的,並發收集,兩個階段會STW(初始標記、重新標記),更加關注停頓時間。在JDK8中已經不推薦使用,JDK8推薦使用G1收集器。

並發:垃圾收集執行緒和業務程式碼執行緒一起跑。但是並不能做到全程一起執行。

因為垃圾收集執行緒在執行的時候對垃圾進行標記,這時業務程式碼執行緒也在執行,也會產生新的垃圾。至少在垃圾收集執行緒在進行標記的階段,業務程式碼暫定的是不執行的。

劃分為四個階段:初始標記、並發標記、重新標記、並發清理。

初始標記:第一階段會Stop The World(STW)。這個階段執行的時間是非常快的,如果開啟多個執行緒,會消耗執行緒之前的切換反而會增加時間成本。

並發標記:第二階段就是可達性分析,對第一階段的垃圾進行跟蹤。在這個階段垃圾執行緒和業務執行緒是一起執行的;為啥可以一起執行呢?因為在第一階段初始標記完成後大局已定,第二階段的並發標記只是做增量的更新。如果此時又產生了垃圾那麼就是浮動垃圾(把原本消亡的對象錯誤的標記為存活狀態),只能等待下次清理。

重新標記:第三階段這時會停止業務程式碼的執行緒Stop The World(STW),會多執行緒垃圾收集器並行一起跑,一起執行。

並發清理:第四階段垃圾收集執行緒和業務程式碼執行緒再次一起執行,一起跑。

特點:並發收集,停頓時間較少。

缺點:會產生浮動垃圾。其次由於採用的是標記-清除這樣的演算法會產生大量的空間碎片。


Serial Old:串列的

Paraller Old:並行的


如何查看當前JAVA程式應用使用的是什麼垃圾收集器:

# 查看進程ID
jps -l
8720 org.jetbrains.jps.cmdline.Launcher
10212 org.jetbrains.idea.maven.server.RemoteMavenServer36
3764
15480 sun.tools.jps.Jps
4216 com.hopefun.scm.WebApplication
# 查看當前進程下是否使用UseParallelGC
jinfo -flag UseParallelGC 4216
-XX:+UseParallelGC

趙小胖個人部落格