JAVA記憶體區域與記憶體溢位異常

高階java架構師發表於2018-09-28

2.1 執行時資料區域

  Java虛擬機器在執行Java程式的過程中把它所管理的記憶體劃分為若干個不同的資料區域。這些區域都有各自的用途,以及建立和銷燬的時間,有的區域隨著虛擬機器程式的啟動而存在,有些區域則依賴使用者執行緒的啟動和結束而建立和銷燬。如下圖所示: 

2.1.1 程式計數器

  程式計數器是一塊較小的記憶體空間,它是執行緒的私有記憶體(隨著執行緒的建立和結束而分配和回收),可以看作時當前執行緒所執行的位元組碼的行號指示器。在虛擬機器的概念模型裡,位元組碼直譯器工作時就是通過改變這個計數器的值來選取下一個需要執行的位元組碼指令,分支,迴圈,跳轉,異常處理,執行緒恢復等基礎功能都需要依賴這個計數器來完成。

  由於Java虛擬機器的多執行緒是通過執行緒輪流切換並分配處理器執行時間的方式來實現的,在任何一個確定的時刻,一個處理器(對於多核處理器來說是一 核心)都只會執行一條執行緒中的指令。因此,為了執行緒切換後能恢復到正確的執行位置,每條執行緒都需要有一個獨立的程式計數器,各個執行緒之間計數器互不影響, 獨立儲存,稱之為“執行緒私有”記憶體。

  如果執行緒正在執行一個Java方法,這個計數器記錄的正是正在執行的虛擬機器位元組碼指令的地址;如果執行緒正在執行一個Native方法,這個計數器則為空(Undefined)。此記憶體區域是唯一一個在Java虛擬機器規範中沒有規定任何OutOfMemoryError情況的區域。

2.1.2 Java虛擬機器棧

  Java虛擬機器棧是執行緒私有的,它的生命週期和執行緒相同。其描述的是Java方法執行的記憶體模型:每個方法在執行的同時都會建立一個棧幀(Java方法執行時的基礎資料結構),用於儲存區域性變數表,運算元棧,動態連結,方法出口等資訊。每一個方法從呼叫直至執行完成的過程,就對應一個棧幀在虛擬機器棧中入棧到出棧的過程。

  區域性變數表:存放了編譯期可知的各種基本資料型別(boolean,byte,char,short,int,float,long,double),物件引用(reference型別,它不等同於物件本身,可能是一個指向物件地址的引用指標,也可能是執行一個代表物件的控制程式碼或其他與此物件相關的位置)和returnAddress型別(指向了一條位元組碼指令的地址)。

  注意:其中64位長度的long和double型別的資料會佔用2個區域性變數空間(Slot),其餘的資料型別只佔用1個。區域性變數表所需的記憶體空間在編譯期間完成分配,當進入一個方法時,這個方法需要在棧幀中分配多大的區域性變數空間是完全確定的,在方法執行期間不會改變區域性變數表的大小。

  在Java虛擬機器規範中,對Java虛擬機器棧規定了兩種異常狀況:(1)如果執行緒請求的深度大於虛擬機器所允許的深度,將丟擲 StackOverflowError異常;(2)如果虛擬機器棧可以動態擴充套件(當前大部分的Java虛擬機器都可動態擴充套件,只不過Java虛擬機器規範中也允許固定長度的虛擬機器棧),如果擴充套件時無法申請到足夠的記憶體,就會丟擲OutOfMemoryError異常。

2.1.3 本地方法棧

  本地方法棧與虛擬機器棧所發揮的作用是非常相似的,它們之間的區別不過是虛擬機器棧為虛擬機器執行Java方法(也就是位元組碼)服務,而本地方法棧則為虛擬機器使用到的Native方法服務有的虛擬機器(比如:Sun HotSpot虛擬機器)直接把本地方法棧和虛擬機器棧合二為一。與虛擬機器棧一樣,本地方法棧區域也會丟擲StackOverflowError和 OutOfMemoryError異常。

2.1.4 Java堆

  對於大多數應用來說,Java堆是Java虛擬機器所管理的記憶體中最大的一塊。被所有執行緒共享的一塊記憶體區域,在虛擬機器啟動時建立。此記憶體區域的唯一目的就是存放物件例項,幾乎所有的物件例項都在這裡分配記憶體。這一點在Java虛擬機器規範中的描述是:所有物件例項以及陣列都要在堆上分配,但是隨著 JIT編譯器的發展與逃逸分析技術逐漸成熟,棧上分配,標量替換優化技術將會導致一些微妙的變化發生,所有的物件都分配在堆上也漸漸變得不是那麼“絕對” 了。

  Java堆是垃圾收集器管理的主要區域,因此也被稱為"GC堆"。從記憶體回收的角度來看,由於現在收集器基本都採用分代收集演算法,所以Java堆中還可以細分為:新生代和老年代,再細緻一點的有Eden空間,From Survivor空間,To Survivor空間等。從記憶體分配的角度來看,執行緒共享的Java堆中可能劃分出多個執行緒私有的分配緩衝區。不過無論如何劃分,都與存放內容無關,無論哪個區域,儲存的都仍然是物件例項,進一步劃分的目的是為了更好地回收記憶體,或者更快地分配記憶體。

  根據Java虛擬機器規範的規定,Java堆可以處於物理上不連續的記憶體空間中,只要邏輯上是連續的即可。可以通過-Xmx和-Xms控制堆記憶體大小。如果在堆中沒有記憶體完成例項分配,並且堆也無法再擴充套件時,將會丟擲OutOfMemoryError異常。

2.1.5 方法區

  方法區與Java堆一樣,是所有執行緒共享的記憶體區域,它用於儲存已被虛擬機器載入的類資訊常量靜態變數即時編譯器編譯後的程式碼等資料。對於習慣在HotSpot虛擬機器上開發,部署程式的開發者來說,很多人願意把方法區稱為“永久代”,本質上兩者並不等價,僅僅是因為HotSpot虛擬機器的設計團隊選擇把GC分代技術擴充套件至方法區,或者說使用永久代來實現方法區而已,這樣HotSpot的垃圾收集器可以像管理Java堆一樣管理這部分記憶體,能夠省去專門為方法區編寫記憶體管理程式碼的工作。對於其他虛擬機器(如:BEA JRockit,IBM J9等)來說是不存在永久代的概念的。原則上,如何實現方法區屬於虛擬機器實現細節,不受虛擬機器規範約束,但使用永久代來實現方法區,現在看來並不是一個好 主意,因為這樣更容易遇到記憶體溢位問題(永久代有-XX:MaxPermSize的上線,J9和JRockit只要沒有觸及到可用記憶體的上限,例如32 系統中的4GB,就不會出現問題),而且有極少數方法(例如String.intern())會因這個原因導致不用虛擬機器下有不同的表現。因此,對於 HotSpot虛擬機器,根據官方釋出的路線圖資訊,現在也有放棄永久代逐步改為採用Native Memory來實現方法區的規劃了,在目前已經發布的JDK 1.7的HotSpot中,已經把原本放在永久代的字串常量池移出。

  Java虛擬機器規範對方法區的限制非常寬鬆,除了和Java堆一樣不需要連續的記憶體和可以選擇固定大小或者可擴充套件外,還可以選擇不實現垃圾收集。相對而言,垃圾收集行為在這個區域是比較少出現的,但並非資料進入了方法區就如永久代的名字一樣“永久”存在了。這區域的記憶體回收目標主要是針對常量池的回收和對型別的解除安裝。根據Java虛擬機器規範的規定,當方法區無法滿足記憶體分配需求時,將丟擲OutOfMemoryError異常。

2.1.6 執行時常量池

  執行時常量池是方法區的一部分。Class檔案中除了有類的版本,欄位,方法,介面等描述資訊外,還有一項資訊是常量池,用於存放編譯期生成的各種字面量和符號引用,這部分內容將在類載入後進入方法區的執行時常量池中存放。

  Java虛擬機器對Class檔案每一部分(自然包含執行時常量池)的格式都有嚴格規定,每一個位元組用於儲存哪種資料都必須符合規範上的要求才會被虛擬機器認可,裝載和執行,但對於執行時常量池,Java虛擬機器規範沒有做任何細節的要求,不同的提供商實現的虛擬機器可以按照自己的需要來實現這個記憶體區域。不過,一般來說,除了儲存 Class檔案中描述的符號引用外,還會把翻譯出來的直接引用也儲存在執行時常量池中。

  執行時常量池相對於Class檔案常量池的另外一個重要特徵是具備動態性,Java語言並不要求常量一定只有編譯器才能產生,也就是並非預置入Class檔案中常量池的內容才能進入方法區執行時常量池,執行期間也可能將新的常量放入池中,這種特性被開發人員利用的比較多的便是String類的 intern()方法。

  既然執行時常量池是方法區的一部分,自然受到方法區記憶體的限制,當常量無法再申請到記憶體時會丟擲OutOfMemoryError異常。

2.1.7 直接記憶體

  直接記憶體(Direct Memory)並不是虛擬機器執行時資料區的一部分,也不是Java虛擬機器規範中定義的記憶體區域。但是這部分記憶體也被頻繁地使用,而且也可能導致OutOfMemoryError異常出現。

  在JDK 1.4中引入了NIO類,引入了一種基於通道(Channel)與緩衝區(Buffer)的IO方式,它可以使用Native函式庫直接分配堆外記憶體,然 後通過一個儲存在Java堆中的DirectByteBuffer物件作為這塊記憶體的引用進行操作。這樣能在一些場景中顯著提高效能,因為避免了在 Java堆和Native堆中來回複製資料。本機直接記憶體的分配不會受到Java堆大小的限制,但是,既然是記憶體,肯定還是受到本機總記憶體大小及處理器定址空間的限制。

2.2 HotSpot虛擬機器物件探祕

2.2.1 物件的建立

  在Java程式執行過程中無時無刻都有物件被建立出來。在語言層面上,建立物件(例如:克隆,反序列化)通常僅僅是一個new關鍵字而已,而在虛擬機器中,物件(文中討論的物件限於普通Java物件,不包括資料和Class物件等)的建立又是怎樣一個過程呢?

  虛擬機器遇到一條new指令時,首先將去檢查這個指令的引數是否能在常量池中定位到一個類的符號引用,並且檢查這個符號引用代表的類是否已被載入,解析和初始化過。如果沒有,那必須先執行相應的類載入過程。在類載入檢查通過後,接下來虛擬機器將為新生物件分配記憶體。物件所需記憶體的大小在類載入完成後便可完全確定,為物件分配空間的任務等同於把一塊確定大小的記憶體從Java對中劃分出來。假設Java堆中記憶體是絕對規整的,所有用過的記憶體都放在一邊,空閒的記憶體放在另一邊,中間放著一個指標作為分界點的指示器,那所分配記憶體就僅僅是把那個指標向空閒空間那邊挪動一段與物件大小相等的距離,這種分配方式稱為“指標碰撞”。如果Java堆中的記憶體並不是規整的,已使用的記憶體和空閒的記憶體相互交錯,那就沒有辦法簡單地進行指標碰撞了,虛擬機器就必須維護一個列表,記錄上哪些記憶體塊是可用的,在分配的時候從列表中找到一塊足夠大的空間劃分給物件例項,並更新列表上的記錄,這種分配方式稱為“空閒列表” 選擇哪種分配方式是由Java堆是否規整決定,而Java堆是否規整又由採用的垃圾收集器是否帶有壓縮整理功能決定。因此,在使用 Serial,ParNew等帶Compact過程的收集器時,採用的分配演算法是指標碰撞,而使用CMS這種基於Mark-Sweep演算法的收集器時,通常採用空閒列表。

  除如何劃分可用空間之外,還有另外一個需要考慮的問題是物件建立在虛擬機器中是非常頻繁的行為,即使是僅僅修改一個指標所指向的位置,在併發情況下也並不是執行緒安全的,可能出現正在給物件A分配記憶體,指標還沒來得及修改,物件B又同時使用了原來的指標來分配記憶體的情況解決這個問題有兩種方案,一種是對分配記憶體空間的動作進行同步處理——實際上虛擬機器採用CAS配上失敗重試的方式保證更新操作的原子性;另一種是把記憶體分配的動作按照執行緒劃分在不同的空間之中進行,即每個執行緒在Java堆中預先分配一小塊記憶體,稱為本地執行緒分配緩衝(TLAB)哪個執行緒要分配記憶體,就在哪個執行緒的TLAB上分配,只有TLAB用完並分配新的TLAB時,才需要同步鎖定。虛擬機器是否使用TLAB,可以通過-XX:+/-UseTLAB引數 來設定。

  記憶體分配完成後,虛擬機器需要將分配到的記憶體空間都初始化為零值(不包括物件頭),如果使用TLAB,這一工作過程也可以提前至TLAB分配時進行。這一步操作保證了物件的例項欄位在Java程式碼中可以不賦初始值就直接使用,程式能訪問到這些欄位的資料型別所對應的零值。

  接下來,虛擬機器要對物件進行必要的設定,例如這個物件是哪個類的例項,如何才能找到類的後設資料資訊,物件的雜湊碼,物件的GC分代年齡等資訊.這些資訊存放在物件的物件頭(Object Header)中。根據虛擬機器當前的執行狀態的不同,如是否啟用偏向鎖等,物件頭會有不同的設定方式。

  在上面工作都完成之後,從虛擬機器的視角來看,一個新的物件已經產生了,但從Java程式的視角來看,物件建立才剛剛開始—— <init>方法還沒有執行,所有的欄位都還為零。所以,一般來說(由位元組碼中是否跟隨invokespecial指令所決定),執行new指令之後會接著執行<init>方法,把物件按照程式設計師的意願進行初始化,這樣一個真正可用的物件才算完全產生出來。

2.2.2 物件的記憶體佈局

  在HotSpot虛擬機器中,物件在記憶體中儲存的佈局可以分為3塊區域:物件頭(Header),例項資料(Instance Data)和對齊補充(Padding)。

  HotSpot虛擬機器的物件頭包括兩部分資訊,第一部分用於儲存物件自身的執行時資料,如雜湊碼 (HashCode),GC分代年齡,鎖狀態標誌,執行緒持有的鎖,偏向執行緒ID,偏向時間戳等這部分資料的長度在32位和64位的虛擬機器(未開啟壓縮指標)中分別為32bit和64bit,官方稱它為“Mark Word”。物件需要儲存的執行時資料很多,其實已經超出了32位,64位Bitmap結構所能記錄的限度,但是物件頭資訊是與物件自身定義的資料無關的額外儲存成本,考慮到虛擬機器的空間效率,Mark Word被設計成一個非固定的資料結構以便在極小的空間記憶體儲儘量多的資訊,它會根據物件的狀態複用自己的儲存空間。

  物件頭的另外一部分是型別指標,即物件指向它的類後設資料的指標,虛擬機器通過這個指標來確定這個物件是哪個類的例項。並不是所有虛擬機器實現都必須在物件資料上保留型別指標,換句話說,查詢物件的後設資料資訊並不一定要經過物件本身。另外,如果物件是一個Java陣列,那在物件頭中還必須有一塊用於記錄陣列長度的資料,因為虛擬機器可以通過普通Java物件的後設資料資訊確定Java物件的大小,但是從陣列的後設資料中卻無法確定陣列的大小。

  例項資料部分是物件真正儲存的有效資訊,也是在程式程式碼中所定義的各種型別的欄位記憶體。無論是從父類繼承下來的,還是在子類中定義的,都需要記錄起來。這部分的儲存順序會受到虛擬機器分配策略引數(FiledsAllocationStyle)和欄位在 Java原始碼中定義順序的影響。HotSpot虛擬機器預設的分配策略為longs/doubles,ints,shorts/chars,bytes /booleans,oops(Ordinary Object Pointers),從分配策略中可以看出,相同寬度的欄位總是被分配到一起。在滿足這個前提條件的情況下,在父類中定義的變數會出現在子類之前。如果 CompactFields引數值為true(預設為true),那麼子類之中較窄的變數也可能會插入到父類變數的空隙之中。

  對齊填充並不是必然存在的,也沒有特別的含義,它僅僅起著佔位符的作用。由於HotSpot VM的自動記憶體管理系統要求物件起始地址必須是8位元組的整數倍,換句話說,就是物件的大小必須是8位元組的整數倍。而物件頭部分正好是8位元組的倍數(1倍或者2倍) 。因此,當物件例項資料部分沒有對齊時,就需要通過對齊填充來補全。

2.2.3 物件的訪問定位

  Java程式需要通過棧上的reference資料來操作堆上的具體物件。由於reference型別在Java 虛擬機器規範中只規定了一個指向物件的引用,並沒有定義這個引用應該通過何種方式去定位,訪問堆中的物件的具體位置,所以物件訪問方式也是取決於虛擬機器實現而定的。目前主流的方式有使用控制程式碼直接指標兩種。

  如果使用控制程式碼訪問的話,那麼Java堆中將會劃分出一塊記憶體來作為控制程式碼池,reference中儲存的就是物件的控制程式碼地址,而控制程式碼中包含了物件例項資料與型別資料各自的具體地址資訊。

  如果使用直接指標訪問,那麼Java堆物件的佈局中就必須考慮如何放置訪問型別資料的相關資訊,而reference中儲存的直接就是物件地址。

  這兩種物件訪問方式各有優勢,使用控制程式碼來訪問的最大好處就是reference中儲存的是穩定的控制程式碼地址,在物件被移動(垃圾收集時移動物件是非常普遍的行為)時只會改變控制程式碼中的例項資料指標,而reference本身不需要修改。使用直接指標訪問方式的最大好處就是速度更快,它節省了一次指標定位的時間開銷,由於物件的訪問在Java中非常頻繁,因此這類開銷積少成多後也是 一項非常可觀的執行成本。Sun HotSpot虛擬機器使用的是第二種方式進行物件訪問的。

2.3 實戰OutOfMemoryError異常

2.3.1 Java堆溢位

  Java堆用於儲存物件例項,只要不斷地建立物件,並且保證GC Roots到物件之間有可達路徑避免垃圾回收機制清除這些物件,那麼在物件數量到達最大堆的容量限制後就會產生記憶體溢位異常。

import java.util.ArrayList;
import java.util.List;

/**
 * VM Args: -Xms20m -Xmx20m -XX:+HeapDumpOnOutOfMemoryError
 * 通過將Xms和Xmx設定大小相等,避免堆自動擴充套件
 * -XX:+HeapDumpOnOutOfMemoryError:可以讓虛擬機器在出現記憶體溢位異常時Dump出當前的記憶體堆儲存快照以便進行分析
 */
public class HeapOOM {
    static class OOMObject {}
    public static void main(String [] args) {
        List<OOMObject> list = new ArrayList<>();
        while (true) {
            list.add(new OOMObject());
        }
    }
}
View Code

執行結果:

java.lang.OutOfMemoryError: Java heap space Dumping heap to java_pid20404.hprof ... Heap dump file created [27642578 bytes in 0.133 secs] Exception in thread "main" java.lang.OutOfMemoryError: Java heap space at java.util.Arrays.copyOf(Arrays.java:2245) at java.util.Arrays.copyOf(Arrays.java:2219) at java.util.ArrayList.grow(ArrayList.java:242) at java.util.ArrayList.ensureExplicitCapacity(ArrayList.java:216) at java.util.ArrayList.ensureCapacityInternal(ArrayList.java:208) at java.util.ArrayList.add(ArrayList.java:440) at com.king.oom.HeapOOM.main(HeapOOM.java:16) at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57) at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43) at java.lang.reflect.Method.invoke(Method.java:606) at com.intellij.rt.execution.application.AppMain.main(AppMain.java:134)
View Code

  要解決這個區域的異常,一般的手段是先通過記憶體映像分析工具對Dump出來的堆轉儲快照進行分析,重點是確認記憶體中的物件是否是必要的,也就是要先分清楚到底是出現了記憶體洩露(Memory Leak)還是記憶體溢位(Memory Overflow)。

  記憶體洩露:指申請的記憶體無法釋放已經申請的記憶體空間。

  記憶體溢位:指程式在申請記憶體時,沒有足夠的記憶體空間可以使用。

  如果是記憶體洩露,可進一步通過工具檢視洩露物件到GC Roots的引用鏈。於是就能找到洩露物件是通過怎樣的路徑與GC Roots相關聯並導致垃圾收集器無法自動回收它們的,就可以比較主準確定位洩露程式碼的位置。

  如果是記憶體溢位,換句話說,就是記憶體中的物件確實都還必須存活著,那就應當檢查虛擬機器的引數(-Xmx與-Xms),與機器實體記憶體對比看是否還可以調大,從程式碼上檢查是否存在某些物件生命週期過長,持有狀態時間過長的情況,嘗試減少程式執行期間的記憶體消耗。

2.3.2 虛擬機器棧和本地方法棧溢位

  由於HotSpot虛擬機器中並不區分虛擬機器棧和本地方法棧,因此,對於HotSpot來說,雖然-Xoss引數(設定本地方法棧大小)存在,但實際上是無效的,棧容量只由-Xss引數設定。關於虛擬機器棧和本地方法棧,在Java虛擬機器規範中描述了兩種異常:

  1. 如果執行緒請求的棧深度大於虛擬機器所允許的最大深度,將丟擲StackOverflowError異常。
  2. 如果虛擬機器在擴充套件棧時無法申請到足夠的記憶體空間,則丟擲OutOfMemoryError異常。

  這裡把異常分成兩種情況,看似更加嚴謹,但卻存在著一些互相重疊的地方:當棧空間無法繼續分配時,到底是記憶體太小,還是已使用的棧空間太大,其本質上只是對同一件事情的兩種描述而已。

/**
 * VM Args: -Xss228k
 */
public class JavaVMStackSOF {

    private int stackLength = 1;

    public void stackLeak() {
        System.out.println(stackLength ++);
        stackLeak();
    }

    public static void main(String [] args) {
        JavaVMStackSOF sof = new JavaVMStackSOF();
        sof.stackLeak();
    }
}
View Code
... 1474 1475 1476 1477 1478 Exception in thread "main" java.lang.StackOverflowError at java.nio.Buffer.limit(Buffer.java:266) at java.nio.Buffer.<init>(Buffer.java:193) at java.nio.CharBuffer.<init>(CharBuffer.java:276) at java.nio.HeapCharBuffer.<init>(HeapCharBuffer.java:70) at java.nio.CharBuffer.wrap(CharBuffer.java:369) at sun.nio.cs.StreamEncoder.implWrite(StreamEncoder.java:265) at sun.nio.cs.StreamEncoder.write(StreamEncoder.java:125) ...
View Code

  在單個執行緒下,無論是由於棧幀太大還是虛擬機器容量太小,當記憶體無法分配的時候,虛擬機器丟擲的都是StackOverflowError異常。如果測試不限於單執行緒,通過不斷地建立執行緒的方式倒是可以產生記憶體溢位異常,但是這樣的記憶體溢位異常與棧空間是否足夠大並不存在任何聯絡,或者準確的說,在這種情況下,為每個執行緒的棧分配記憶體越大,反而越容易產生記憶體溢位異常。其實原因不難理解,作業系統分配給每個程式的記憶體是有限制的,比如:32位的Windows限制為2GB,虛擬機器提供了引數來控制Java堆和方法區的這兩部分記憶體的最大值(-Xmx:最大堆容量;-XX:MaxPermSize:最大方法區容量;)。如果虛擬機器程式本身耗費的記憶體不計算在內,剩下 的記憶體就由虛擬機器棧和本地方法棧“瓜分”了。每個執行緒分配到的棧容量越大,可以建立的執行緒數量自然就越少,建立執行緒時就越容易把剩下的記憶體耗盡。

  如果使用虛擬機器預設引數,棧深度在大多數情況下(因為每個方法壓入棧的棧幀大小並不是一樣的,所以只能說在大多數情況下)達到1000~2000完全沒問題,對於正常的方法呼叫(包括遞迴),這個深度應該完全夠用了。但是,如果是建立過多執行緒導致的記憶體溢位,在不能減少執行緒數或者更換64位虛擬機器的情況下,就只能通過減少最大堆,減少棧容量和減少最大方法區容量來換取更多的執行緒。

/**
 * VM Args:-Xss2M
 */
public class JavaVMStackOOM {

    private void dontStop() {
        while (true);
    }

    public void stackLeakByThread() {
        while (true) {
            new Thread(new Runnable() {
                @Override
                public void run() {
                    dontStop();
                }
            }).start();
        }
    }

    public static void main(String [] args) {
        JavaVMStackOOM oom = new JavaVMStackOOM();
        oom.stackLeakByThread();
    }
}
View Code

2.3.3 方法區和執行時常量池溢位

  String.intern()是一個Native方法,它的作用是:如果字串常量池中已經包含一個等於此 String物件的字串,則返回代表池中這個字串的String物件;否則,將此String物件包含的字串新增到常量池中,並且返回此 String物件的引用。在JDK 1.6及之前的版本中,由於常量池分配在永久代內,可以通過-XX:PermSize和-XX:MaxPermSize限制方法區大小,從而間接限制常量池的容量。

import java.util.List;
import com.google.common.collect.Lists;
/**
 * VM Args:-XX:PermSize=10M -XX:MaxPermSize=10M
 */
public class RuntimeConstantPoolOOM {
    public static void main(String [] args) {
        // 使用List保持著常量池引用 避免Full GC回收常量池行為
        List<String> list = Lists.newArrayList();
        // 10MB的PermSize在integer範圍內足夠產生OOM了
        int i = 0;
        while (true) {
            list.add(String.valueOf(i++).intern());
        }
    }
}
View Code

  在JDK1.6下,執行時常量池溢位,在OutOfMemoryError後面跟隨的提示資訊是“PermGen space”,說明執行時常量池屬於方法區(HotSpot虛擬機器中的永久代)的一部分。而使用JDK1.7執行程式就不會得到相同的結果,while迴圈將一直進行下去。

import java.util.List;
import com.google.common.collect.Lists;
/**
 * VM Args:-XX:PermSize=10M -XX:MaxPermSize=10M
 */
public class RuntimeConstantPoolOOM {
    public static void main(String [] args) {

        String str1 = new StringBuilder("計算機").append("軟體").toString();
        System.out.println(str1.intern() == str1);

        String str2 = new StringBuilder("ja").append("va").toString();
        System.out.println(str2.intern() == str2);
    }
}
View Code

  以上程式碼在JDK 1.6中,會得到兩個false,而在JDK 1.7中執行,會得到一個true和一個false。產生差異的原因:在JDK 1.6中,intern()方法會把首次遇到的字串例項複製到永久代中,返回的也是永久代中這個字串例項的引用,而由StringBuilder建立的字串例項在Java堆上,所以必然不是同一個引用,將返回false。而在JDK 1.7的intern()實現不會再複製例項,只是在常量池中記錄首次出現的例項引用,因此intern()返回的引用和由StringBuilder建立的那字串例項是同一個。對str2比較返回false是因為“java”這個字串在執行StringBuilder.toString()之前已 經出現過,字串常量池中已經有它的引用了,不符合“首次出現”的原則,而“計算機軟體”這個字串則是首次出現,因此返回true。

  方法區用於存放Class的相關資訊,如類名,訪問修飾符,常量池,欄位描述,方法描述等。對於這些區域的測試,基本的思路是執行時產生大量的類去填滿方法區,直到溢位。下面通過CGLIB實現方法區溢位:

import net.sf.cglib.proxy.Enhancer;
import net.sf.cglib.proxy.MethodInterceptor;
import net.sf.cglib.proxy.MethodProxy;

import java.lang.reflect.Method;
/**
 * VM Args: -XX:PermSize=10M -XX:MaxPermSize=10M
 */
public class JavaMethodAreaOOM {
    public static void main(String [] args) {
        while (true) {
            Enhancer enhancer = new Enhancer();
            enhancer.setSuperclass(OOMObject.class);
            enhancer.setUseCache(false);
            enhancer.setCallback(new MethodInterceptor() {
                @Override
                public Object intercept(Object obj, Method method, Object[] args, MethodProxy proxy) throws Throwable {
                    return proxy.invoke(obj, args);
                }
            });
            enhancer.create();
        }
    }

    static class OOMObject {}
}
View Code

  方法區溢位也是一種常見的記憶體溢位異常,一個類要被垃圾收集器回收掉,判定條件是比較苛刻的。在經常動態生成大量Class的應用中,需要特別注意類的回收狀況。這類場景除了上面提到的程式使用了CGLIB位元組碼增強和動態語言之外,常見的還有:大量JSP或動態產生JSP檔案的應用(JSP第一次執行時需要編譯為Java類),基於OSGI的應用(即使是同一個類檔案,被不同的類載入器載入也會被視為不同的類)等。

2.3.4 本機直接記憶體溢位

  DirectMemory容量可以通過-XX:MaxDirectMemorySize指定,如果不指定,則預設與Java堆最大值(-Xmx指 定)一樣。下面程式碼越過了DirectByteBuffer類,直接通過反射獲取Unsafe例項進行記憶體分配(Unsafe類的getUnsafe() 方法限制了只有引導類載入器才會返回例項,也就是隻有rt.jar中的類才能使用Unsafe的功能)。因此,雖然使用DirectByteBuffer分配記憶體也會丟擲記憶體溢位異常,但它丟擲異常時並沒有真正向作業系統申請分配記憶體,而是通過計算的值記憶體無法分配,於是手動丟擲異常,真正申請分配記憶體的 方法是unsafe.allocateMemory()。

import java.lang.reflect.Field;
import sun.misc.Unsafe;
/**
 * VM Args: -Xmx20M -XX:MaxDirectMemorySize=10M
 */
public class DirectMemoryOOM {
    private static final int _1MB = 1024 * 1024;
    public static void main(String [] args) throws IllegalAccessException {
        Field unsafeField = Unsafe.class.getDeclaredFields()[0];
        unsafeField.setAccessible(true);
        Unsafe unsafe = (Unsafe) unsafeField.get(null);
        while (true) {
            unsafe.allocateMemory(_1MB);
        }
    }
}
View Code

  由DirectMemory導致的記憶體溢位,一個明顯特徵是在Heap Dump檔案中不會看見明顯的異常。如果發現OOM之後Dump檔案很小,而程式中有直接或間接使用了NIO,可以考慮這個原因。

相關文章