jvm堆記憶體和GC簡介

大鵬SP發表於2020-10-15

最近經常遇到jvm記憶體問題,覺得還是有必要整理下jvm記憶體的相關邏輯,這裡只描述jvm堆記憶體,對外記憶體暫不闡述。

jvm記憶體簡圖

  1. jvm記憶體分為堆記憶體和非堆記憶體,堆記憶體分為年輕代、老年代,非堆記憶體裡只有個永久代。

  2. 年輕代分為生成區(Eden)和倖存區(Survivor),倖存區由FromSpace和Tospace兩部分組成,預設情況下,記憶體大小比例:Eden:FromSpace:ToSpace 為 8:1:1。

  3. 堆記憶體存放的是物件,垃圾收集器回收的就是這裡的物件,不同區域的物件根據不同的GC演算法回收,比如年輕代對應Minor GC,老年代對應Major GC。

  4. 非堆記憶體即永久代,也稱為方法區,儲存的是程式執行時長期存活的物件,比如類的後設資料、方法、常量、屬性等。

  5. 在jdk1.8廢棄了永久代,使用元空間(MetaSpace)取而代之,元空間儲存的物件與永久代相同,區別是:元空間並不在jvm中,使用的是本地記憶體。

    為什麼移除永久代呢

​ 為融合HotSpot JVM與JRockit VM(新JVM技術)而做出的改變,因為JRockit沒有永久代。

分代概念

首先,GC是Garbage Collection,即垃圾回收。

​ 新生成的物件首先存放在生成區,當生成區滿了,觸發Minor GC,存活下來的物件轉移到Survivor0,即FromSpace,Survivor0區滿後觸發執行Minor GC,存活物件移動到Suvivor1區,即ToSpace,經過多次Minor GC仍然存活的物件轉移到老年代。

​ 所以老年代儲存的是長期活動的物件,當老年代滿了會觸發Major GC。

​ Minor GC和Major GC是俗稱,有些情況下Major GC和Full GC是等價的,如果出發了Full GC,那麼所有執行緒必須等待GC完成才能繼續(見GC分類和演算法)。

分代原因

​ 將物件根據存活概率進行分類,對存活時間長的物件,放到固定區,從而減少掃描垃圾時間及GC頻率。針對分類進行不同的垃圾回收演算法,對演算法揚長避短。

為什麼倖存區分為大小相同的兩部分:S0,S1

​ 主要為了解決碎片化,因為回收一部分物件後,剩餘物件佔用的記憶體不連續,也就是碎片化,過於嚴重的話,當前連續的記憶體不夠新物件存放就會觸發GC,這樣會提高GC的次數,降低效能,當S0 GC後存活物件轉移到S1後存活物件佔用的就是連續的記憶體。

GC分類和相關演算法

我們來看下GC分類,才能清楚什麼時候觸發Full GC、和非Full GC,GC大致分為兩種:

  • Partial GC:並不收集整個GC堆的模式,即可以理解為非Full GC
    • Young GC:只收集young gen的GC
    • Old GC:只收集old gen的GC。只有CMS有這個模式
    • Mixed GC:收集整個young gen以及部分old gen的GC。只有G1有這個模式
  • Full GC:收集整個堆,包括young gen、old gen、perm gen(如果存在的話)等所有部分的模式。

上面說的CMS和G1都是GC的演算法,相關GC演算法如下:

  1. Serial GC演算法:Serial Young GC + Serial Old GC (實際上它是全域性範圍的Full GC);

  2. Parallel GC演算法:Parallel Young GC + 非並行的PS MarkSweep GC / 並行的Parallel Old GC(這倆實際上也是全域性範圍的Full GC),選PS MarkSweep GC 還是 Parallel Old GC 由引數UseParallelOldGC來控制;

  3. CMS演算法:ParNew(Young)GC + CMS(Old)GC + Full GC for CMS演算法;

  4. G1 GC演算法:Young GC + mixed GC(新生代,再加上部分老生代)+ Full GC for G1 GC演算法(應對G1 GC演算法某些時候的不趕趟,開銷很大);

GC觸發條件

  • Young GC:各種Young GC觸發的條件都是Eden區滿了。

  • Serial Old GC/PS MarkSweep GC/Parallel Old GC:當準備要觸發一次young GC時,如果發現統計資料說之前young GC的平均晉升大小比目前old gen剩餘的空間大,則不會觸發young GC而是轉為觸發full GC。

  • Full GC for CMS:老年代使用比率超過某個值。

  • Full GC for G1 GC:Heap使用比率超過某個值。

  • 如果有perm gen的話,要在perm gen分配空間但已經沒有足夠空間時,也要觸發一次full GC。

    小結:不同演算法對應的GC回收條件是不同的。

    GC方式

    標記-清除(Mark-Sweep)

    ​ GC分為兩個階段,標記和清除。首先標記所有可回收的物件,在標記完成後統一回收所有被標記的物件。同時會產生不連續的記憶體碎片,碎片過多會導致以後程式執行時需要分配較大物件時,無法找到足夠的連續記憶體,而不得已再次觸發GC。

    紅色代表被標記的可回收物件,綠色代表存活物件

    清除後如下:

    複製(Copy)

​ 將記憶體按容量劃分為兩塊,每次只使用其中一塊。當這一塊記憶體用完了,就將存活的物件複製到另一塊上,然後再把已使用的記憶體空間一次清理掉。這樣使得每次都是對半個記憶體區回收,也不用考慮記憶體碎片問題,簡單高效。缺點需要兩倍的記憶體空間。
清除前後如下:


標記-整理(Mark-Compact)

​ 也分為兩個階段,首先標記可回收的物件,再將存活的物件都向一端移動,然後清理掉邊界以外的記憶體。此方 法避免標記-清除演算法的碎片問題,同時也避免了複製演算法的空間問題。

​ 一般年輕代中執行GC後,會有少量的物件存活,就會選用複製演算法,只要付出少量的存活物件複製成本就可以 完成收集。而老年代中因為物件存活率高,沒有額外過多記憶體空間分配,就需要使用標記-清理或者標記-整理演算法來進行回收。
清除前後如下:

GC演算法引數

引數 描述
-XX:+UseSerialGC 序列收集器
-XX:+UseParallelGC 並行收集器
-XX:+UseParallelGCThreads=8 並行收集器執行緒數,同時有多少個執行緒進行垃圾回收,一般與CPU數量相等
-XX:+UseParallelOldGC 指定老年代為並行收集
-XX:+UseConcMarkSweepGC CMS收集器(併發收集器)
-XX:+UseCMSCompactAtFullCollection 開啟記憶體空間壓縮和整理,防止過多記憶體碎片
-XX:CMSFullGCsBeforeCompaction=0 表示多少次Full GC後開始壓縮和整理,0表示每次Full GC後立即執行壓縮和整理
-XX:CMSInitiatingOccupancyFraction=80% 表示老年代記憶體空間使用80%時開始執行CMS收集,防止過多的Full GC
-XX:+UseG1GC G1收集器
-XX:MaxTenuringThreshold=0 在年輕代經過幾次GC後還存活,就進入老年代,0表示直接進入老年代

OOM原因

1)老年代記憶體不足:java.lang.OutOfMemoryError:Javaheapspace
2)永久代記憶體不足:java.lang.OutOfMemoryError:PermGenspace
3)程式碼bug,佔用記憶體無法及時回收。

​ 可以通過新增個引數-XX:+HeapDumpOnOutMemoryError,讓虛擬機器在出現記憶體溢位異常時Dump出當前的記憶體堆轉儲快照以便事後分析。

相關文章