淺析堆與垃圾回收

今天你做題了嗎發表於2020-07-02

  這篇文章我們主要關注這些問題::Java程式執行完後,堆中的物件什麼時候被回收?如何回收?

  堆又叫做 “GC堆,"由於現在收集器基本都採用分代收集演算法,所以Java堆還可以細分為:新生代和老年代,比例是1:2;再細緻一點新生代內部又劃分為Eden區、Survivor區,比例為8:1。下圖顯示了堆的結構:

  物件在堆中記憶體的分配是有嚴格規定的,策略為:

  • 物件優先在新生代Eden區分配記憶體;
  • 大物件直接進老年代,主要是長字串和陣列這些需要大量連續記憶體空間的物件;
  • 長期存活的物件進入老年代。Eden區記憶體不夠時,JVM發起一次MinorGC,物件的年齡加一,預設物件年齡到15時進入老年代;
  • 動態年齡判定。相同年齡所有物件大小的總和大於 Survivor 空間的一半,大於等於該年齡的物件進入老年代。

新生代 GC指Minor GC,在新生代的進行垃圾回收,頻繁且快。 老年代 GC(Major GC/Full GC)在老年代進行垃圾回收,通常伴隨著至少一次的minor gc。速度慢。Full GC在如下幾種情況下都會被觸發:

  1. 老年代空間不足;
  2. 方法區空間不足;
  3. 呼叫System.gc(),建議JVM進行full gc;
  4. 長期存活的物件轉入老年代,空間不足;
  5. 沒有足夠的連續空間分配給大物件;
  6. 新生代垃圾回收存活的物件太多,S1放不下,老年代擔保空間不足,擔保空間指的是老年代最大可用的連續空間是否大於新生代所有物件總空間。

  堆裡面幾乎放了所有的物件,那我們怎麼知道這些物件是否還有用呢?JVM提供了兩種方法來判定:

  • 引用計數法:給物件新增一個引用計數器,每次被引用,計數器值加一,引用失效,計數器值減一,當引用數為0時,表示物件不存活。引用計數法無法解決迴圈引用問題,周志朋老師書裡面有詳細的例子,也是比較容易理解的。
  • 可達性分析法:以 ”GC Roots“物件為起始點,就像是樹的根節點,向下搜尋,搜尋走過的路徑稱為引用鏈,如果一個物件到 GC Roots起始點沒有引用鏈,則此物件不可達,是需要被回收的。GC Roots是指虛擬機器棧引用的物件,本地方法棧引用的物件,方法區靜態屬性引用的物件,方法區常量引用的物件。

  上面提到了引用,物件的存活都和引用有關,引用型別又分為強引用,軟引用,弱引用,虛引用。

  • 強引用,new出來的物件,垃圾回收器絕不會回收它;
  • 軟引用,在系統將要發生OMM前會回收這些物件的記憶體;
  • 弱引用,垃圾收集器工作時只要發現,馬上回收;
  • 虛引用,形同虛設,任何時候都可能被回收。

  實際上可達性分析法判定的不可達物件不會馬上回收,物件真正被回收需要經過兩次標記。第一次標記就是被判定為不可達物件,然後進行一次篩選,篩選條件是此物件是否有必要執行finalize()方法。如果沒有重寫finalize()方法或者finalize()方法已經被虛擬機器呼叫過,finalize()方法只會被系統呼叫一次。這兩種情況都是”沒有必要執行的“。如果有必要,這個物件會被放在F-Quene佇列中,由虛擬機器自動建立的低優先順序的Finalizer執行緒去執行finalize()方法。這期間GC會對F-Quene中的物件進行第二次小規模標記,如果物件依然沒有被引用,那就會被回收,沒有被篩選的物件不一定被回收。

 我們已經知道物件什麼時候被回收了,那如何回收呢?介紹四種最常用的垃圾回收演算法:

  • 標記-清除:先標記需清除的物件,統一回收----效率不高,會產生大量不連續的碎片;
  • 複製演算法:將記憶體分塊,每次只使用一塊,使用完後,將存活的物件複製到另一塊上;
  • 標記整理:先標記存活物件,然後讓所有存活物件向一端移動,直接清理端邊界以外的記憶體;
  • 分代演算法,堆分隊新生代和老年代,新生代每次收集都會有大量的物件死去,選擇複製演算法。老年代存活率比較高,且沒有額外空間進行分配擔保,選擇標記清除或者標記整理演算法。

 垃圾收集演算法是一種記憶體回收的思想,具體的實現是垃圾收集器。簡要介紹下常用的垃圾收集器:

  • serial序列收集器。單執行緒,垃圾回收的時候,必須暫停其他工作。新生複製,老年標記整理。簡單高效;
  • ParNew 收集器。serial的多執行緒版本;
  • Parallel Scavenge 收集器,複製演算法的多執行緒收集器。注重吞吐量,cpu執行程式碼時間/cpu耗時總時間。新生複製,老年標記整理;
  • Serial Old 收集器,老年代版本;
  • Parallel Old 收集器,Parallel Scavenge老年代版本;
  • CMS 收集器,注重最短時間停頓。併發收集器,垃圾收集執行緒與使用者執行緒(基本上)同時工作。 標記清除演算法

  關於垃圾收集器更多的細節可以閱讀周志朋老師的書。

 

參考資料:《深入理解Java虛擬機器》第二版 周志朋

     《深入拆解Java虛擬機器》鄭雨迪

     《JVM虛擬機器底層原理分析與效能調優》程式設計師諸葛 

 

 

相關文章