理解JVM(二):垃圾收集演算法

Joepis發表於2018-06-20

判斷哪些物件需要被回收

  • 引用計數演算法:
    • 給物件中新增一個引用計數器,每當有一個地方引用時,計數器值就加1;當引用失效時,計數器值就減1;任何時刻計數器為0的物件就是不可能再被使用的。 但是JVM沒有使用此方法,因為此方法無法解決2個物件相互迴圈引用的問題。
  • 可達性分析演算法:
    • 這個演算法的基本思路就是通過一系列的稱為“GC Roots”的物件作為起始點,從這些節點開始向下搜尋,搜尋所走過的路徑稱為引用鏈(Reference Chain),當一個物件到GC Roots沒有任何引用鏈相連時,則證明此物件是不可用的。
  • 在Java語言中,可作為GC Roots的物件包括下面幾種:
    • 虛擬機器棧(棧幀中的本地變數表)中引用的物件。
    • 方法區中類靜態屬性引用的物件。
    • 方法區中常量引用的物件。
    • 本地方法棧中JNI(即一般說的Native方法)引用的物件。

JDK1.2以後的引用分為4種,引用強度依次逐漸減弱

  • 強引用(Strong Reference)
    • 強引用就是指在程式程式碼之中普遍存在的,類似Object obj=new Object()這類的引用,只要強引用還存在,垃圾收集器永遠不會回收掉被引用的物件。
  • 軟引用(Soft Reference)
    • 軟引用是用來描述一些還有用但並非必需的物件。對於軟引用關聯著的物件,在系統將要發生記憶體溢位異常之前,將會把這些物件列進回收範圍之中進行第二次回收。如果這次回收還沒有足夠的記憶體,才會丟擲記憶體溢位異常。在JDK1.2之後,提供了SoftReference類來實現。
  • 弱引用(Weak Reference)
    • 弱引用也是用來描述非必需物件的,但是它的強度比軟引用更弱一些,被弱引用關聯的物件只能生存到下一次垃圾收集發生之前。當垃圾收集器工作時,無論當前記憶體是否足夠,都會回收掉只被弱引用關聯的物件。在JDK1.2之後,提供了WeakReference類來實現。
  • 虛引用(Phantom Reference)
    • 虛引用也稱為幽靈引用或者幻影引用,它是最弱的一種引用關係。一個物件是否有虛引用的存在,完全不會對其生存時間構成影響,也無法通過虛引用來取得一個物件例項。為一個物件設定虛引用關聯的唯一目的就是能在這個物件被收集器回收時收到一個系統通知。在JDK 1.2之後,提供了PhantomReference類來實現。

垃圾收集演算法

標記-清除演算法(Mark-Sweep)

  • 此方法分為“標記”和“清除”兩個階段:首先標記出所有需要回收的物件,在標記完成後統一回收所有被標記的物件。它是最基礎的收集演算法,後續的收集演算法都是基於這種思路並對其不足進行改進而得到的。
  • 主要兩個不足:一個是效率問題,標記和清除兩個過程的效率都不高;另一個是空間問題,標記清除之後會產生大量不連續的記憶體碎片,空間碎片太多可能會導致以後在程式執行過程中需要分配較大物件時,無法找到足夠的連續記憶體而不得不提前觸發另一次垃圾收集動作。

理解JVM(二):垃圾收集演算法

複製演算法(Copying)

  • 此方法將可用記憶體按容量劃分為大小相等的兩塊,每次只使用其中的一塊。當這一塊的記憶體用完了,就將還存活著的物件複製到另外一塊上面,然後再把已使用過的記憶體空間一次清理掉。這樣使得每次都是對整個半區進行記憶體回收,記憶體分配時也就不用考慮記憶體碎片等複雜情況,只要移動堆頂指標,按順序分配記憶體即可,實現簡單,執行高效。但是可用記憶體變成原來的一半,代價較大。

  • 此方法一般用在回收新生代,因為新生代的物件98%都是很快就會被回收,所以不用1:1劃分,而是分為一塊較大的Eden空間和2塊較小的Survivor空間。每次使用Eden和其中一塊Survivor。當回收時,將Eden和Survivor中還存活著的物件一次性地複製到另外一塊Survivor空間上,最後清理掉Eden和剛才用過的Survivor空間。HotSpot虛擬機器預設Eden和Survivor的大小比例是8:1:1,即新生代中可用記憶體為90%,只有10%被浪費。

    理解JVM(二):垃圾收集演算法

標記-整理演算法(Mark-Compact)

  • 複製收集演算法在物件存活率較高時就要進行較多的複製操作,效率將會變低。更關鍵的是,如果不想浪費50%的空間,就需要有額外的空間進行分配擔保,以應對被使用的記憶體中所有物件都100%存活的極端情況,所以在老年代一般不能直接選用這種演算法。
  • 根據老年代的特點,有人提出了另外一種“標記-整理”(Mark-Compact)演算法,標記過程仍然與“標記-清除”演算法一樣,但後續步驟不是直接對可回收物件進行清理,而是讓所有存活的物件都向一端移動,然後直接清理掉端邊界以外的記憶體。

理解JVM(二):垃圾收集演算法

分代收集演算法(Generational Collection)

  • 當前商業虛擬機器的垃圾收集都採用“分代收集”演算法,這種演算法並沒有什麼新的思想,只是根據物件存活週期的不同將記憶體劃分為幾塊。一般是把Java堆分為新生代和老年代,這樣就可以根據各個年代的特點採用最適當的收集演算法。在新生代中,每次垃圾收集時都發現有大批物件死去,只有少量存活,那就選用複製演算法,只需要付出少量存活物件的複製成本就可以完成收集。而老年代中因為物件存活率高、沒有額外空間對它進行分配擔保,就必須使用“標記—清理”或者“標記—整理”演算法來進行回收。

相關文章