深入理解多執行緒(二)—— Java的物件模型

HollisChuang發表於2018-08-17

上一篇文章中簡單介紹過synchronized關鍵字的方式,其中,同步程式碼塊使用monitorentermonitorexit兩個指令實現,同步方法使用ACC_SYNCHRONIZED標記符實現。後面幾篇文章會從JVM原始碼的角度更加深入,層層剝開synchronized的面紗。

在進入正題之前,肯定有些基礎知識需要鋪墊,那麼先來看一下一個容易被忽略的但是又很重要的知識點 —— Java物件模型 。

大家都知道的是,Java物件儲存在堆記憶體中。在記憶體中,一個Java物件包含三部分:物件頭、例項資料和對齊填充。其中物件頭是一個很關鍵的部分,因為物件頭中包含鎖狀態標誌、執行緒持有的鎖等標誌。這篇文章就主要從Java物件模型入手,找一找我們關係的物件頭以及物件頭中和鎖相關的執行時資料在JVM中是如何表示的。

Java的物件模型

任何一個接觸過Java的人都知道,Java是一種面嚮物件語言。在學習Java的過程中你一定對下面兩句話不陌生:

  • 1、在物件導向的軟體中,物件(Object)是某一個類(Class)的例項。 維基百科

  • 2、一切皆物件 Thinking In Java

我們還知道,在JVM的記憶體結構中,物件儲存在堆記憶體中,而我們在對物件進行操作時,其實操作的是物件的引用。那麼物件本身在JVM中的結構是什麼樣的呢?本文的所有分析均基於HotSpot虛擬機器。

oop-klass model

HotSpot是基於c++實現,而c++是一門物件導向的語言,本身是具備物件導向基本特徵的,所以Java中的物件表示,最簡單的做法是為每個Java類生成一個c++類與之對應。但HotSpot JVM並沒有這麼做,而是設計了一個OOP-Klass Model。OOP(Ordinary Object Pointer)指的是普通物件指標,而Klass用來描述物件例項的具體型別。

為什麼HotSpot要設計一套oop-klass model呢?答案是:HotSopt JVM的設計者不想讓每個物件中都含有一個vtable(虛擬函式表)

這個解釋似乎可以說得通。眾所周知,C++和Java都是物件導向的語言,面嚮物件語言有一個很重要的特性就是多型。關於多型的實現,C++和Java有著本質的區別。

多型是物件導向的最主要的特性之一,是一種方法的動態繫結,實現執行時的型別決定物件的行為。多型的表現形式是父類指標或引用指向子類物件,在這個指標上呼叫的方法使用子類的實現版本。多型是IOC、模板模式實現的關鍵。

在C++中通過虛擬函式表的方式實現多型,每個包含虛擬函式的類都具有一個虛擬函式表(virtual table),在這個類物件的地址空間的最靠前的位置存有指向虛擬函式表的指標。在虛擬函式表中,按照宣告順序依次排列所有的虛擬函式。由於C++在執行時並不維護型別資訊,所以在編譯時直接在子類的虛擬函式表中將被子類重寫的方法替換掉。

在Java中,在執行時會維持型別資訊以及類的繼承體系。每一個類會在方法區中對應一個資料結構用於存放類的資訊,可以通過Class物件訪問這個資料結構。其中,型別資訊具有superclass屬性指示了其超類,以及這個類對應的方法表(其中只包含這個類定義的方法,不包括從超類繼承來的)。而每一個在堆上建立的物件,都具有一個指向方法區型別資訊資料結構的指標,通過這個指標可以確定物件的型別。

上面這段是我從網上摘取過來的,說的有一定道理,但是也不全對。至於為啥,我會在後文介紹到Klass的時候細說。

關於opp-klass模型的整體定義,在HotSpot的原始碼中可以找到。

oops模組可以分成兩個相對獨立的部分:OOP框架和Klass框架。

oopsHierarchy.hpp裡定義了oop和klass各自的體系。

oop-klass結構

oops

oop體系:

//定義了oops共同基類
typedef class   oopDesc*                            oop;
//表示一個Java型別例項
typedef class   instanceOopDesc*            instanceOop;
//表示一個Java方法
typedef class   methodOopDesc*                    methodOop;
//表示一個Java方法中的不變資訊
typedef class   constMethodOopDesc*            constMethodOop;
//記錄效能資訊的資料結構
typedef class   methodDataOopDesc*            methodDataOop;
//定義了陣列OOPS的抽象基類
typedef class   arrayOopDesc*                    arrayOop;
//表示持有一個OOPS陣列
typedef class   objArrayOopDesc*            objArrayOop;
//表示容納基本型別的陣列
typedef class   typeArrayOopDesc*            typeArrayOop;
//表示在Class檔案中描述的常量池
typedef class   constantPoolOopDesc*            constantPoolOop;
//常量池告訴快取
typedef class   constantPoolCacheOopDesc*   constantPoolCacheOop;
//描述一個與Java類對等的C++類
typedef class   klassOopDesc*                    klassOop;
//表示物件頭
typedef class   markOopDesc*                    markOop;
複製程式碼

上面列出的是整個Oops模組的組成結構,其中包含多個子模組。每一個子模組對應一個型別,每一個型別的OOP都代表一個在JVM內部使用的特定物件的型別。

從上面的程式碼中可以看到,有一個變數opp的型別是oppDesc ,OOPS類的共同基型別為oopDesc

**在Java程式執行過程中,每建立一個新的物件,在JVM內部就會相應地建立一個對應型別的OOP物件。**在HotSpot中,根據JVM內部使用的物件業務型別,具有多種oopDesc的子類。除了oppDesc型別外,opp體系中還有很多instanceOopDescarrayOopDesc 等型別的例項,他們都是oopDesc的子類。

OOP結構

這些OOPS在JVM內部有著不同的用途,例如**,instanceOopDesc表示類例項,arrayOopDesc表示陣列。**也就是說,當我們使用new建立一個Java物件例項的時候,JVM會建立一個instanceOopDesc物件來表示這個Java物件。同理,當我們使用new建立一個Java陣列例項的時候,JVM會建立一個arrayOopDesc物件來表示這個陣列物件。

在HotSpot中,oopDesc類定義在oop.hpp中,instanceOopDesc定義在instanceOop.hpp中,arrayOopDesc定義在arrayOop.hpp中。

簡單看一下相關定義:

class oopDesc {
  friend class VMStructs;
  private:
      volatile markOop  _mark;
      union _metadata {
        wideKlassOop    _klass;
        narrowOop       _compressed_klass;
      } _metadata;

  private:
      // field addresses in oop
      void*     field_base(int offset)        const;

      jbyte*    byte_field_addr(int offset)   const;
      jchar*    char_field_addr(int offset)   const;
      jboolean* bool_field_addr(int offset)   const;
      jint*     int_field_addr(int offset)    const;
      jshort*   short_field_addr(int offset)  const;
      jlong*    long_field_addr(int offset)   const;
      jfloat*   float_field_addr(int offset)  const;
      jdouble*  double_field_addr(int offset) const;
      address*  address_field_addr(int offset) const;
}


class instanceOopDesc : public oopDesc {
}

class arrayOopDesc : public oopDesc {
}
複製程式碼

通過上面的原始碼可以看到,instanceOopDesc實際上就是繼承了oopDesc,並沒有增加其他的資料結構,也就是說instanceOopDesc中主要包含以下幾部分資料:markOop _markunion _metadata 以及一些不同型別的 field

HotSpot虛擬機器中,物件在記憶體中儲存的佈局可以分為三塊區域:物件頭、例項資料和對齊填充。在虛擬機器內部,一個Java物件對應一個instanceOopDesc的物件。其中物件頭包含了兩部分內容:_mark_metadata,而例項資料則儲存在oopDesc中定義的各種field中。

_mark

文章開頭我們就說過,之所以我們要寫這篇文章,是因為物件頭中有和鎖相關的執行時資料,這些執行時資料是synchronized以及其他型別的鎖實現的重要基礎,而關於鎖標記、GC分代等資訊均儲存在_mark中。因為本文主要介紹的oop-klass模型,在這裡暫時不對物件頭做展開,下一篇文章介紹。

_metadata

前面介紹到的_metadata是一個共用體,其中_klass是普通指標,_compressed_klass是壓縮類指標。在深入介紹之前,就要來到oop-Klass中的另外一個主角klass了。

klass

klass體系

//klassOop的一部分,用來描述語言層的型別
class  Klass;
//在虛擬機器層面描述一個Java類
class   instanceKlass;
//專有instantKlass,表示java.lang.Class的Klass
class     instanceMirrorKlass;
//專有instantKlass,表示java.lang.ref.Reference的子類的Klass
class     instanceRefKlass;
//表示methodOop的Klass
class   methodKlass;
//表示constMethodOop的Klass
class   constMethodKlass;
//表示methodDataOop的Klass
class   methodDataKlass;
//最為klass鏈的端點,klassKlass的Klass就是它自身
class   klassKlass;
//表示instanceKlass的Klass
class     instanceKlassKlass;
//表示arrayKlass的Klass
class     arrayKlassKlass;
//表示objArrayKlass的Klass
class       objArrayKlassKlass;
//表示typeArrayKlass的Klass
class       typeArrayKlassKlass;
//表示array型別的抽象基類
class   arrayKlass;
//表示objArrayOop的Klass
class     objArrayKlass;
//表示typeArrayOop的Klass
class     typeArrayKlass;
//表示constantPoolOop的Klass
class   constantPoolKlass;
//表示constantPoolCacheOop的Klass
class   constantPoolCacheKlass;
複製程式碼

oopDesc是其他oop型別的父類一樣,Klass類是其他klass型別的父類。

klass

Klass向JVM提供兩個功能:

  • 實現語言層面的Java類(在Klass基類中已經實現)
  • 實現Java物件的分發功能(由Klass的子類提供虛擬函式實現)

文章開頭的時候說過:之所以設計oop-klass模型,是因為HotSopt JVM的設計者不想讓每個物件中都含有一個虛擬函式表。

HotSopt JVM的設計者把物件一拆為二,分為klassoop,其中oop的職能主要在於表示物件的例項資料,所以其中不含有任何虛擬函式。而klass為了實現虛擬函式多型,所以提供了虛擬函式表。所以,關於Java的多型,其實也有虛擬函式的影子在。

_metadata是一個共用體,其中_klass是普通指標,_compressed_klass是壓縮類指標。這兩個指標都指向instanceKlass物件,它用來描述物件的具體型別。

instanceKlass

JVM在執行時,需要一種用來標識Java內部型別的機制。在HotSpot中的解決方案是:為每一個已載入的Java類建立一個instanceKlass物件,用來在JVM層表示Java類。

來看下instanceKlass的內部結構:

  //類擁有的方法列表
  objArrayOop     _methods;
  //描述方法順序
  typeArrayOop    _method_ordering;
  //實現的介面
  objArrayOop     _local_interfaces;
  //繼承的介面
  objArrayOop     _transitive_interfaces;
  //域
  typeArrayOop    _fields;
  //常量
  constantPoolOop _constants;
  //類載入器
  oop             _class_loader;
  //protected域
  oop             _protection_domain;
      ....
複製程式碼

可以看到,一個類該具有的東西,這裡面基本都包含了。

這裡還有個點需要簡單介紹一下。

在JVM中,物件在記憶體中的基本存在形式就是oop。那麼,物件所屬的類,在JVM中也是一種物件,因此它們實際上也會被組織成一種oop,即klassOop。同樣的,對於klassOop,也有對應的一個klass來描述,它就是klassKlass,也是klass的一個子類。klassKlass作為oop的klass鏈的端點。關於物件和陣列的klass鏈大致如下圖:

400_ac3_932

在這種設計下,JVM對記憶體的分配和回收,都可以採用統一的方式來管理。oop-klass-klassKlass關係如圖:

2579123-5b117a7c06e83d84

記憶體儲存

關於一個Java物件,他的儲存是怎樣的,一般很多人會回答:物件儲存在堆上。稍微好一點的人會回答:物件儲存在堆上,物件的引用儲存在棧上。今天,再給你一個更加顯得牛逼的回答:

物件的例項(instantOopDesc)儲存在堆上,物件的後設資料(instantKlass)儲存在方法區,物件的引用儲存在棧上。

其實如果細追究的話,上面這句話有點故意賣弄的意思。因為我們都知道。方法區用於儲存虛擬機器載入的類資訊、常量、靜態變數、即時編譯器編譯後的程式碼等資料。 所謂載入的類資訊,其實不就是給每一個被載入的類都建立了一個 instantKlass物件麼。

talk is cheap ,show me the code :

class Model
{
    public static int a = 1;
    public int b;

    public Model(int b) {
        this.b = b;
    }
}

public static void main(String[] args) {
    int c = 10;
    Model modelA = new Model(2);
    Model modelB = new Model(3);
}
複製程式碼

儲存結構如下:

20170615230126453

從上圖中可以看到,在方法區的instantKlass中有一個int a=1的資料儲存。在堆記憶體中的兩個物件的oop中,分別維護著int b=3,int b=2的例項資料。和oopDesc一樣,instantKlass也維護著一些fields,用來儲存類中定義的類資料,比如int a=1

總結

每一個Java類,在被JVM載入的時候,JVM會給這個類建立一個instanceKlass,儲存在方法區,用來在JVM層表示該Java類。當我們在Java程式碼中,使用new建立一個物件的時候,JVM會建立一個instanceOopDesc物件,這個物件中包含了兩部分資訊,物件頭以及後設資料。物件頭中有一些執行時資料,其中就包括和多執行緒相關的鎖的資訊。後設資料其實維護的是指標,指向的是物件所屬的類的instanceKlass

we

參考資料

【理解HotSpot虛擬機器】物件在jvm中的表示:OOP-Klass模型

Java反射: 從JDK到JVM全鏈路詳解

HotSpotVM 物件機制實現淺析#1

HotSpot實戰

相關文章