Class類檔案結構

weixin_34120274發表於2017-08-18

宣告:本文摘抄自《深入理解Java虛擬機器》一書,本文完全為自我學習,請感興趣的同學購買正版,支援原創

Java虛擬機器不和包括Java語言在內的任何語言繫結,它只與“Class檔案”這種特定的二進位制檔案所關聯。Class檔案中包含了Java虛擬機器指令集和符號表以及若干輔助資訊。

Class檔案結構

Class檔案是以8位位元組為基礎單位的二進位制流,各項資料專案嚴格按照順序緊湊的排列在Class檔案之中,中間沒有新增任何分割符,這使的整個Class檔案中儲存的內容幾乎全部是程式執行所必須的資料,沒有空隙存在。當遇到需要佔用8位元組以上空間的資料項時,則會按照高位在前的方式分割成若干個8為位元組進行儲存。

根據Java虛擬機器規範,Class檔案格式採用類似與C語言結構體的偽結構來儲存資料,這種結構只有兩種資料型別:無符號數和表。對Class檔案解析都是基於這兩種資料型別進行的。

無符號數屬於基本資料型別,以u1,u2,u4,u8來分別表示1個位元組,2個位元組,4個位元組和8個位元組的無符號數,無符號數可以用來描述數字,索引引用,數量值或者按照UTF-8編碼構成的字串值。

表是由多個無符號數或其他表為資料項構成的複合資料型別,所有表都習慣性以“_info”結尾。表用於描述有層次關係的複合結構的資料。


2209198-d55777a8a2bb1c46.png
Class檔案結構

無論是無符號數還是表,當需要描述同一型別但數量不定的多個資料時,經常會使用一個前置的容量計數器加若干個連續的資料項的形式,這時稱這一連續的某一型別的資料為某一型別的集合。

魔數與Class檔案的版本

每個Class檔案的頭4個位元組稱為魔數(Magic Number),它的唯一作用就是確定這個檔案是否為一個能被虛擬機器接受的Class檔案。很多檔案儲存標準中都使用魔數來進行身份識別,譬如圖片格式,如gif或者jpeg等在檔案頭中都存在魔數。Class檔案的魔數為“0xCAFEBABE”。

緊接著魔數後4個位元組儲存的是Class檔案的版本號:第5和第6個位元組是次版本號(Minor Version),第7和第8位元組是主版本號(Major Version)。高版本的JDK能向下相容以前版本的Class檔案,但不能執行以後版本的Class檔案,即使檔案格式並未發生任何變化,虛擬機器也拒絕執行超過其版本號的Class檔案。

2209198-4a9b4f704a25a5a8.png
Class檔案版本號
常量池

緊接著主版本號之後就是常量池入口。常量池是Class檔案結構中與其他專案關聯最多的資料型別,也是佔用Class檔案空間最大的資料之一。由於常量池中常量個數是不固定的,所以在常量池的入口需要一項u2型別的資料,來代表常量池中常量個數(constant_pool_count)。與Java中語言習慣不一樣的是,這個容量計數是從1而不是0開始的(第0項常量空出來有特殊考慮)。Class檔案結構中只有常量池的容量計數是從1開始,對於其他集合型別,包括介面索引集合,欄位表集合,方法集合等容量計數都與一般習慣相同,是從0開始的。

常量池中主要存放兩大類常量:字面量(Literal)符號引用(Symbolic Refereces)
字面量比較接近與Java語言層面的常量概念,如文字字串,宣告為final型別的常量值等。
符號引用則屬於編譯原理方面的概念,包括了下面三類常量:

  • 類和介面的全限定名(Fully Qualified Name)
  • 欄位的名稱和描述符(Descriptor)
  • 方法的名稱和描述符

常量池目前共有14種結構,常量池是最繁瑣的資料,因為這14種常量型別各自均有自己的結構。


Java 相關規範:http://docs.oracle.com/javase/specs/index.html
Java虛擬機器規範《The Java Virtual Machine Specification》
[JDK7]:http://docs.oracle.com/javase/specs/jvms/se7/html/index.html
[JDK8]:http://docs.oracle.com/javase/specs/jvms/se8/html/index.html

相關文章