JVM之物件的建立、記憶體佈局、訪問走位總結

leonsir發表於2019-03-13

Born


  Java是一門物件導向的語言,在Java程式執行的過程中無時無刻都有物件被建立出來。在語言層面上,建立物件通常僅僅是一個new關鍵字而已,而在虛擬機器中,物件(本文討論僅限於普通Java物件,不包括陣列和Class物件)的建立又是一個怎樣的過程呢?

1. 類載入檢查

  當虛擬機器需要一條new指令時,首先會去檢查這個指令的引數是否能在常量池中定位到一個類的符號引用,並且檢查這個符號引用是否已經被載入、解析初始化過。如果沒有,那必須先執行相應的類載入過程。   

2. 分配記憶體

  在類載入檢查通過後,接下來虛擬機器將為新生物件分配記憶體(所需記憶體大小在類載入完成後遍可完全確定)。所謂分配記憶體,就等同於把一塊確定大小的記憶體從Java堆中劃分出來(物件例項存在於JVM記憶體區域的堆區域)。根據Java堆中的記憶體是否規整,將分配方式分為兩種:

  • 指標碰撞(Java堆記憶體規整)

  記憶體規整的含義是,所有用過的記憶體都放在一邊,空閒的記憶體放在另一邊,中間放著一個指標作為分界點的指示器,那麼分配記憶體就僅僅是把那個指標向空閒空間那邊挪動一段與物件大小相等的距離。

  • 空閒列表(Java堆記憶體不規整)

  記憶體不規整的含義是,已使用的記憶體和空閒的記憶體相互交錯。如果是這樣那就沒法簡單的進行指標碰撞了,那麼分配記憶體的方式就變為,虛擬機器維護一個列表,記錄哪些記憶體是可用的,哪些記憶體是不可用的,在分配的時候從列表中找到一塊足夠大的空間劃分給物件例項,並更新列表上的記錄。

注: 選擇哪種分配方式是由Java堆是否規整而決定,而Java堆是否規整又由所採用的的垃圾收集器是否帶壓縮整理功能決定。

2.1 記憶體分配的併發問題

  在建立物件的時候有一個很重要的問題,那就是執行緒安全,因為在實際開發中,建立物件是很頻繁的事,即使是僅僅修改一個指標所指向的位置,在併發情況下也並不是執行緒安全的,可能出現正在給物件A分配記憶體,指標還沒來得及修改,物件B又同時使用了原來的指標來分配記憶體情況。

解決上述為題通常有兩種方案:

  • CAS+失敗重試

  CAS是樂觀鎖的一種實現方式。所謂樂觀鎖就是,每次不加鎖而是假設沒有衝突而去完成某項操作,如果因為衝突失敗就重試,直到成功為止。虛擬機器採用CAS配上失敗重試的方式來保證更新操作的原子性。

  • TLAB

  為每一個執行緒預先在Eden區分配一塊記憶體,JVM在給執行緒中的物件分配記憶體時,首先在TLAB分配,當物件大於TLAB中的剩餘記憶體TLAB記憶體已用盡時,再採用第一種方法(CAS+失敗重試)進行記憶體分配。

3. 初始化零值

  記憶體分配完成之後,虛擬機器需要將分配到的記憶體空間都初始化為零值(不包括物件頭),這一步操作保證了物件的例項欄位在Java程式碼中可以不賦初始值就能直接使用,程式能訪問到這些欄位的資料型別所對用的零值。

4. 設定物件頭

  初始化零值完成之後,虛擬機器要對物件進行必要的設定,例如這個物件是哪個類的例項、如果才能找到類的後設資料資訊、物件的雜湊碼、物件的GC分代年齡等資訊。這些資訊都存在物件頭中。另外,根據虛擬機器當前執行狀態的不同,如是否啟用偏向鎖等,物件頭會有不同的設定方式。

5. 執行init方法

  在上面的工作都完成之後,從虛擬機器的視角來看,一個新的物件已經產生了,但是從Java程式的角度來看,物件的建立才剛剛開始,<init>方法還沒有執行,所有的欄位都為零。所以一般來說,執行new指令之後會接著指向<init>方法,把物件按照程式設計師的意願進行初始化,這樣一個真正可用的物件才算完全產生出來。

物件的記憶體佈局


在HotSpot虛擬機器中,物件的記憶體中儲存的佈局可以分為3塊區域:物件頭、例項資料、和對其填充

  • 物件頭

HotSpot虛擬機器的物件頭包括兩部分資訊,第一部分: 用於儲存物件自身的自身執行資料(雜湊碼、GC分代年齡、鎖狀態標誌燈);第二部分: 是型別指標,即物件指向它的類後設資料的指標,虛擬機器通過這個指標來確定這個物件是哪個類的例項。

  • 例項資料

例項資料是物件真正儲存的有效資訊,也是在程式中所定義的各種花型別的欄位內容。

  • 對其填充

對其填充部分不是必然存在的,也沒有什麼特別的含義,僅僅起佔作用。 因為Hotspot虛擬機器的自動記憶體管理系統要求物件起始地址必須是8位元組的整數倍,換句話說就是物件的大小必須是8位元組的整數倍。而物件頭部分正好是8位元組的倍數(1倍或2倍),因此,當物件例項資料部分沒有對齊時,就需要通過對齊填充來補全。

物件的訪問走位


建立物件就是為了使用物件,我們Java程式通過棧上的reference資料來操作堆上的具體物件。物件的訪問方式由虛擬機器實現,目前主流的訪問方式有兩種:控制程式碼訪問、直接指標。

  • 控制程式碼訪問

如果使用控制程式碼訪問的話,那麼Java堆中將會劃分出來一塊記憶體作為控制程式碼池,reference中儲存的就是物件的控制程式碼地址,而控制程式碼中包含了物件例項資料與型別資料各自的具體地址資訊。如下圖所示。

JVM之物件的建立、記憶體佈局、訪問走位總結

  • 直接指標

如果使用直接指標訪問,那麼Java堆物件的佈局中就必須考慮如何放置訪問型別資料的相關資訊,而reference中儲存的直接就是物件地址。如下圖所示。

JVM之物件的建立、記憶體佈局、訪問走位總結

兩者優缺點:

訪問方式 優點 缺點
控制程式碼訪問 reference中儲存的是穩定的控制程式碼地址,在物件被移動時只會改變控制程式碼中的例項資料指標,而 reference 本身不需要修改 速度相對較慢
直接指標 速度快,它節省了一次指標定位的時間開銷 由於對物件的訪問在Java總非常頻繁,因此這類開銷極少成多之後,也是很大的成本

參考資料


  • 周志明:《深入理解Java虛擬機器》

相關文章