[深入理解Java虛擬機器]第二章 記憶體區域

Coding-lover發表於2015-10-04

概述

對於從事C、C++程式開發的開發人員來說,在記憶體管理領域,他們既是擁有最高權力的“皇帝”又是從事最基礎工作的“勞動人民”—— 既擁有每一個物件的“所有權”,又擔負著每一個物件生命開始到終結的維護責任。

對於Java程式設計師來說,在虛擬機器自動記憶體管理機制的幫助下,不再需要為每一個new操 作去寫配對的delete/free程式碼 ,不容易出現記憶體洩漏和記憶體溢位問題,由虛擬機器管理記憶體這—切看起來都很美好。不過,也正是因為Java程式設計師把記憶體控制的權力交給了Java虛擬機器, 一旦出現記憶體洩漏和溢位方面的問題,如果不瞭解虛擬機器是怎樣使用記憶體的,那麼排查錯誤將會成為一項異常艱難的工作。

本章是第二部分的第1章 ,筆者將從概念上介紹Java虛擬機器記憶體的各個區域,講解這些區域的作用、服務物件以及其中可能產生的問題,這是翻越虛擬機器記憶體管理這堵圍牆的第一步。

執行時資料區域

Java虛擬機器在執行Java程式的過程中會把它所管理的記憶體劃分為若干個不同的資料區域。這些區域都有各自的用途,以及建立和銷毀的時間,有的區域隨著虛擬機器程式的啟動而存在,有些區域則依賴使用者執行緒的啟動和結束而建立和銷毀。根據《 Java虛擬機器規範(Java SE 7版 )》的規定,Java虛擬機器所管理的記憶體將會包括以下幾個執行時資料區域,如圖2-1所示:

程式計數器

程式計數器(Program Counter Register ) 是一塊較小的記憶體空間,它可以看作是當前執行緒所執行的位元組碼的行號指示器。在虛擬機器的概念模型裡(僅是概念模型,各種虛擬機器可能會通過一些更高效的方式去實現),位元組碼直譯器工作時就是通過改變這個計數器的值來選取下一條需要執行的位元組碼指令,分支、迴圈、跳轉、異常處理、執行緒恢復等基礎功能都需要依賴這個計數器來完成。

由於Java虛擬機器的多執行緒是通過執行緒輪流切換並分配處理器執行時間的方式來實現的, 在任何一個確定的時刻,一個處理器(對於多核處理器來說是一個核心)都只會執行一條執行緒中的指令。因此 ,為了執行緒切換後能恢復到正確的執行位置,每條執行緒都需要有一個獨立的程式計數器,各條執行緒之間計數器互不影響,獨立儲存,我們稱這類記憶體區域為“執行緒私有”的記憶體。

如果執行緒正在執行的是一個Java方法 ,這個計數器記錄的是正在執行的虛擬機器位元組碼指令的地址;如果正在執行的是Native方法,這個計數器值則為空(Undefined )。此記憶體區域是唯一一個在Java虛擬機器規範中沒有規定任何OutOfMemoryError情況的區域。

Java虛擬機器棧

與程式計數器一樣 ,Java虛擬機器棧( Java Virtual Machine Stacks ) 也是執行緒私有的,它的生命週期與執行緒相同。虛擬機器棧描述的是java方法執行的記憶體模型:每個方法在執行的同時都會建立一個棧幀( Stack Frame )用於儲存區域性變數表、運算元棧、動態連結、方法出口等資訊。每一個方法從呼叫直至執行完成的過程,就對應著一個棧幀在虛擬機器棧中入棧到出棧的過程。

經常有人把Java記憶體區分為堆記憶體( Heap )和棧記憶體( Stack),這種分法比較粗
糙 ,Java記憶體區域的劃分實際上遠比這複雜。這種劃分方式的流行只能說明大多數程式設計師最關注的、與物件記憶體分配關係最密切的記憶體區域是這兩塊。其中所指的“堆”筆者在後面會專門講述,而所指的“棧”就是現在講的虛擬機器棧,或者說是虛擬機器棧中區域性變數表部分。

區域性變數表存放了編譯期可知的各種基本資料型別(boolean、byte、char、short、int、 float、long、 double ) 、物件引用(reference型別,它不等同於物件本身,可能是一個指向物件起始地址的引用指標,也可能是指向一個代表物件的控制程式碼或其他與此物件相關的位置)和 returnAddress型別 (指向了一條位元組碼指令的地址)。

其中64位長度的long和double型別的資料會佔用2個區域性變數空間(Slot) ,其餘的資料型別只佔用1個。區域性變數表所需的記憶體空間在編譯期間完成分配,當進入一個方法時,這個方法需要在幀中分配多大的區域性變數空間是完全確定的,在方法執行期間不會改變區域性變數表的大小。

在Java虛擬機器規範中,對這個區域規定了兩種異常狀況:如果執行緒請求的棧深度大於虛擬機器所允許的深度,將丟擲StackOverflowError異常 ;如果虛擬機器棧可以動態擴充套件(當前大部分的Java虛擬機器都可動態擴充套件,只不過Java虛擬機器規範中也允許固定長度的虛擬機器棧),如果擴充套件時無法申請到足夠的記憶體,就會丟擲OutOfMemoryError異常。

本地方法棧

本地方法棧( Native Method Stack)與虛擬機器找所發揮的作用是非常相似的,它們之間的區別不過是虛擬機器棧為虛擬機器執行Java方法 (也就是位元組碼)服務 ,而本地方法棧則為虛擬機器使用到的Native方法服務。在虛擬機器規範中對本地方法棧中方法使用的語言、使用方式與資料結構並沒有強制規定,因此具體的虛擬機器可以自由實現它。甚至有的虛擬機器(譬如 Sun HotSpot虛擬機器)直接就把本地方法棧和虛擬機器棧合二為一 。與虛擬機器棧一樣,本地方法棧區域也會拋 StackOverflowError和OutOfMemoryError異常。

Java堆

對於大多數應用來說,Java堆 ( Java Heap ) 是Java虛擬機器所管理的記憶體中最大的一塊。 Java堆是被所有執行緒共享的一塊記憶體區域,在虛擬機器啟動時建立。此記憶體區域的唯一目的就是存放物件例項,幾乎所有的物件例項都在這裡分配記憶體。這一點在Java虛擬機器規範中的描述 是 :所有的物件例項以及陣列都要在堆上分配,但是隨著JIT編譯器的發展與逃逸分析技術逐漸成熟,找上分配、標量替換優化技術將會導致一些微妙的變化發生,所有的物件都分配在堆上也漸漸變得不是那麼“絕對” 了。

Java堆是垃圾收集器管理的主要區域,因此很多時候也被稱做“GC堆” ( Garbage Collected Heap , 幸好國內沒翻譯成“垃圾堆” )。從記憶體回收的角度來看,由於現在收集器基本都採用分代收集演算法,所以Java堆中還可以細分為:新生代和老年代;再細緻一點的有 Eden空間、 From Survivor空間、 To Survivor空間等。從記憶體分配的角度來看,執行緒共享的 Java堆中可能劃分出多個執行緒私有的分配緩衝區( Thread Local Allocation Buffer,TLAB )。不 過無論如何劃分,都與存放內容無關,無論哪個區域,儲存的都仍然是物件例項,進一步劃 分的目的是為了更好地回收記憶體,或者更快地分配記憶體。在本章中,我們僅僅針對記憶體區域的作用進行討論,Java堆中的上述各個區域的分配、回收等細節將是第3章的主題。

根據Java虛擬機器規範的規定,Java堆可以處於物理上不連續的記憶體空間中,只要邏輯上是連續的即可,就像我們的磁碟空間一樣。在實現時,既可以實現成固定大小的,也可以是可擴充套件的,不過當前主流的虛擬機器都是按照可擴充套件來實現的(通過-Xmx和-Xms控制 )。如果在堆中沒有記憶體完成例項分配,並且堆也無法再擴充套件時,將會丟擲OutOfMemoryError異常。

方法區

方法區( Method Area ) 與Java堆一樣,是各個執行緒共享的記憶體區域,它用於儲存已被虛擬機器載入的類資訊、常量、靜態變數、即時編譯器編譯後的程式碼等資料。雖然Java虛擬機器規範把方法區描述為堆的一個邏輯部分,但是它卻有一個別名叫做Non-Heap ( 非堆),目的應該是與Java堆區分開來。

對於習慣在HotSpot虛擬機器上開發、部署程式的開發者來說,很多人都更願意把方法區稱為“永久代” ( Permanent Generation),本質上兩者並不等價,僅僅是因為HotSpot虛擬機器的設計團隊選擇把GC分代收集擴充套件至方法區,或者說使用永久代來實現方法區而已,這樣 HotSpot的垃圾收集器可以像管理Java堆一樣管理這部分記憶體,能夠省去專門為方法區編寫記憶體管理程式碼的工作。對於其他虛擬機器(如BEAJRockit、ffiM J9等 )來說是不存在永久代的概念的。原則上 ,如何實現方法區屬於虛擬機器實現細節,不受虛擬機器規範約束,但使用永久代來實現方法區,現在看來並不是一個好主意,因為這樣更容易遇到記憶體溢位問題(永久代有-XX : MaxPermSize的上限,J9和JRockit只要沒有觸碰到程式可用記憶體的上限,例如32位系統中的4GB ,就不會出現問題),而且有極少數方法(例如String.intern())會因這個原因導致不同虛擬機器下有不同的表現。因此 ,對於HotSpot虛擬機器 ,根據官方釋出的路線圖資訊 ,現在也有放棄永久代並逐步改為採用Native Memory來實現方法區的規劃了,在目前已 經發布的JDK 1.7的HotSpot中,已經把原本放在永久代的字串常量池移出。

Java虛擬機器規範對方法區的限制非常寬鬆,除了和Java堆一樣不需要連續的記憶體和可以選擇固定大小或者可擴充套件外,還可以選擇不實現垃圾收集。相對而言,垃圾收集行為在這個區域是比較少出現的,但並非資料進入了方法區就如永久代的名字一樣“永久”存在了。這區域的記憶體回收目標主要是針對常量池的回收和對型別的解除安裝,一般來說,這個區域的回收“成績”比較難以令人滿意,尤其是型別的解除安裝,條件相當苛刻,但是這部分割槽域的回收確 實是必要的。在Sun公司的BUG列表中,曾出現過的若干個嚴重的BUG就是由於低版本的HotSpot虛擬機器對此區域未完全回收而導致記憶體洩漏。

根據Java虛擬機器規範的規定,當方法區無法滿足記憶體分配需求時,將丟擲 OutOfMemoryError異常。

執行時常量池

執行時常量池( Runtime Constant Pool)是方法區的一部分。Class檔案中除了有類的版本、欄位、方法、介面等描述資訊外,還有一項資訊是常量池( Constant Pool Table ) ,用於存放編譯期生成的各種字面量和符號引用,這部分內容將在類載入後進入方法區的執行時常量池中存放。

Java虛擬機器對Class檔案每一部分(自然也包括常量池)的格式都有嚴格規定,每一個位元組用於儲存哪種資料都必須符合規範上的要求才會被虛擬機器認可、裝載和執行,但對於執行時常量池,Java虛擬機器規範沒有做任何細節的要求,不同的提供商實現的虛擬機器可以按照自己的需要來實現這個記憶體區域。不過,一般來說,除了儲存Class檔案中描述的符號引用外, 還會把翻譯出來的直接引用也儲存在執行時常量池中.

執行時常量池相對於Class檔案常量池的另外一個重要特徵是具備動態性,Java語言並不要求常量一定只有編譯期才能產生,也就是並非預置入Class檔案中常量池的內容才能進入方法區執行時常量池,執行期間也可能將新的常量放入池中,這種特性被開發人員利用得比較多的便是String類的intern()方法。

既然執行時常量池是方法區的一部分,自然受到方法區記憶體的限制,當常量池無法再申請到記憶體時會丟擲OutOfMemoryError異常。

直接記憶體

直接記憶體(Direct Memory ) 並不是虛擬機器執行時資料區的一部分,也不是Java虛擬機器規範中定義的記憶體區域。但是這部分記憶體也被頻繁地使用,而且也可能導致OutOfMemoryError 異常出現,所以我們放到這裡一起講解。

在JDK 1.4中新加入了NIO ( Newlnput/Output) 類 ,引入了一種基於通道(Channel ) 與緩衝區(Buffer ) 的I/O方式,它可以使用Native函式庫直接分配堆外記憶體,然後通過一個儲存在Java堆中的DirectByteBuffer物件作為這塊記憶體的引用進行操作。這樣能在一些場景中顯著提高效能,因為避免了在Java堆和Native堆中來回複製資料。

顯然 ,本機直接記憶體的分配不會受到Java堆大小的限制,但是 ,既然是記憶體,肯定還是會受到本機總記憶體(包括RAM以及SWAP區或者分頁檔案)大小以及處理器定址空間的限制。伺服器管理員在配置虛擬機器引數時,會根據實際記憶體設定-Xmx等引數資訊,但經常忽略直接記憶體,使得各個記憶體區域總和大於實體記憶體限制(包括物理的和作業系統級的限制), 從而導致動態擴充套件時出現OutOfMemoryError異常。

相關文章