java - 垃圾收集演算法

weixin_34007291發表於2017-11-13

1. 標記-清除演算法

首先標記出所有需要回收的物件,在標記完成後統一回收所有被標記的物件.

存在的問題:
    1. 效率問題: 標記和清除兩個過程的效率都不高.
    1. 空間問題: 標記清除之後會產生大量不連續的記憶體碎片.
2220902-e80f1c14b1ac7454.png
標記-清除演算法

2. 複製演算法

為了解決效率問題
它將可用記憶體按容量劃分為大小相等的兩塊,每次只使用其中的一塊。 當這一塊的記憶體用了,就將還存活著的物件複製到另外一塊上面,然後再把已使用過的記憶體空間一次清理掉。

優缺點
  • 優點: 實現簡單,執行高效. 每次都是對整個半區進行記憶體回收,記憶體分配時也就不用考慮記憶體碎片等複雜情況,只要移動堆頂指標,按順序分配記憶體即可。
  • 缺點: 代價是將記憶體縮小為了原來的一半,未免太高了一點。
2220902-2debf122f738e291.png
複製演算法示意圖

現在的商業虛擬機器都採用這種收集演算法來回收新生代,IBM公司的專門研究表明,新生代中的物件98%是“朝生夕死”的,所以並不需要按照1:1的比例來劃分記憶體空間,而是將記憶體分為一塊較大的Eden空間和兩塊較小的Survivor空間,每次使用Eden和其中一塊Survivor。當回收時,將Eden和Survivor中還存活著的物件一次性地複製到另外一塊Survivor空間上,最後清理掉Eden和剛才用過的Survivor空間。 HotSpot虛擬機器預設Eden和Survivor的大小比例是8:1,也就是每次新生代中可用記憶體空間為整個新生代容量的90%(80%+10%),只有10%的記憶體會被“浪費”。 當然,98%的物件可回收只是一般場景下的資料,我們沒有辦法保證每次回收都只有不多於10%的物件存活,當Survivor空間不夠用時,需要依賴其他記憶體(這裡指老年代)進行分配擔保(Handle Promotion)。

3. 標記-整理演算法

複製收集演算法在物件存活率較高時就要進行較多的複製操作,效率將會變低。更關鍵的是,如果不想浪費 50% 的空間,就需要有額外的空間進行分配擔保,以應對被使用的記憶體中所有物件都 100% 存活的極端情況,所以在老年代一般不能直接選用這種演算法。
標記過程仍然與“標記-清除”演算法一樣,但後續步驟不是直接對可回收物件進行清理,而是讓所有存活的物件都向一端移動,然後直接清理掉端邊界以外的記憶體

2220902-29c1a0fca25258cb.png
“標記-整理”演算法示意圖

4. 分代收集演算法

是一種組合演算法: "複製演算法"+"標記-清除演算法".
根據物件存活週期的不同將記憶體劃分為幾塊(一般將堆分為新生代和老年代),根據各個年代的特點採用最適當的收集演算法.

  • 新生代: 複製演算法,這塊一般都有大量物件死去,只需要付出少量存活物件的複製成本,
  • 老年代:標記-清除演算法,物件存活率高,沒有額外空間對它進行分擔擔保.

相關文章