【面經】面試官:講講類的載入、連結和初始化?

冰河團隊發表於2020-11-03

寫在前面

在前幾年面試Java高階程式設計師的時候,只要是會一點JVM的基礎知識,基本就都能夠面試通過了。最近幾年,對Java工程師的要求越來越嚴格,對於中級Java工程師來說,也需要掌握JVM相關的知識了。這不,一名讀者出去面試Java中級崗位,就被問及了JVM相關的類的載入、連結和初始化的問題。

概述

本文我們一起討論Java類的載入、連結和初始化。 Java位元組程式碼的表現形式是位元組陣列(byte[]),而Java類在JVM中的表現形式是 java.lang.Class類 的物件。一個Java類從位元組程式碼到能夠在JVM中被使用,需要經過載入、連結和初始化這三個步驟。這三個步驟中,對開發人員直接可見的是Java類的加 載,通過使用Java類載入器(class loader)可以在執行時刻動態的載入一個Java類;而連結和初始化則是在使用Java類之前會發生的動作。本文會詳細介紹Java類的載入、連結和 初始化的過程。

Java 類的載入

Java類的載入是由類載入器來完成的。

一般來說,類載入器分成兩類:啟動類載入器(bootstrap)和使用者自定義的類載入器(user-defined)。

兩者的區別在於啟動類載入器是由JVM的原生程式碼實現的,而使用者自定義的類載入器都繼承自Java中的 java.lang.ClassLoader類。在使用者自定義類載入器的部分,一般JVM都會提供一些基本實現。應用程式的開發人員也可以根據需要編寫自己的類載入器。 JVM中最常使用的是系統類載入器(system),它用來啟動 Java應用程式的載入。通過java.lang.ClassLoader的 getSystemClassLoader()方法可以獲取到該類載入器物件。

類載入器需要完成的最終功能是定義一個Java類,即把Java位元組程式碼轉換成JVM中的java.lang.Class類的物件。但是類載入的過程並不是這麼簡單。

Java類載入器有兩個比較重要的特徵:層次組織結構和代理模式。

層次組織結構指的是每個類載入器都有一個父類載入器,通過 getParent()方法可以獲取到。類載入器通過這種父親-後代的方式組織在一起,形成樹狀層次結構。代理模式則指的是一個類載入器既可以自己完成Java類的定義工作,也可以代理給其它的類載入器來完成。由於代理模式的存在,啟動一個類的載入過程的類載入器和最終定義這個類的類載入器可能並不是一個。前者稱為初始類載入器, 而後者稱為定義類載入器。

兩者的關聯在於:一個Java類的定義類載入器是該類所匯入的其它Java類的初始類載入器。比如類A通過import匯入了類 B,那麼由類A的定義類載入器負責啟動類B的載入過程。一般的類載入器在嘗試自己去載入某個Java類之前,會首先代理給其父類載入器。當父類載入器找不到的時候,才會嘗試自己載入。這個邏輯是封裝在java.lang.ClassLoader類的 loadClass()方法中的。一般來說,父類優先的策略就足夠好了。在某些情況下,可能需要採取相反的策略,即先嚐試自己載入,找不到的時候再代理給父類載入器。這種做法在Java的Web容器中比較常見,也是 Servlet規範推薦的做法。比如,Apache Tomcat為每個Web應用都提供一個獨立的類載入器,使用的就是自己優先載入的策略。 IBM WebSphere Application Server則允許Web應用選擇。

類載入器使用的策略

類載入器的一個重要用途是在JVM中為相同名稱的Java類建立隔離空間。在JVM中,判斷兩個類是否相同,不僅是根據該類的二進位制名稱 ,還需要根據兩個類的定義類載入器。只有兩者完全一樣,才認為兩個類是相同的。因此,即便是同樣的Java位元組程式碼,被兩個不同的類載入器定義之後,所得到的Java類也是不同的。如果試圖在兩個類的物件之間進行賦值操作,會丟擲 java.lang.ClassCastException。這個特性為同樣名稱的Java類在JVM中共存創造了條件。在實際的應用中,可能會要求同一名稱的Java類的不同版本在JVM中可以同時存在。通過類載入器就可以滿足這種需求。這種技術在 OSGi中得到了廣泛的應用

Java 類的連結

Java類的連結指的是將Java類的二進位制程式碼合併到JVM的執行狀態之中的過程。在連結之前,這個類必須被成功載入。類的連結包括驗證、準備和解析等幾個步驟。驗證是用來確保Java類的二進位制表示在結構上是完全正確的。如果驗證過程出現錯誤的話,會丟擲 java.lang.VerifyError錯誤。

準備過程則是建立Java類中的靜態域,並將這些域的值設為預設值。準備過程並不會執行程式碼。在一個Java類中會包含對其它類或介面的形式引用,包括它的父類、所實現的介面、方法的形式引數和返回值的Java類等。解析的過程就是確保這些被引用的類能被正確的找到。解析的過程可能會導致其它的 Java類被載入。不同的 JVM 實現可能選擇不同的解析策略。

一種做法是在連結的時候,就遞迴的把所有依賴的形式引用都進行解析。而另外的做法則可能是隻在一個形式引用真正需要的時候才進行解析。也就是說如果一個 Java 類只是被引用了,但是並沒有被真正用到,那麼這個類有可能就不會被解析。考慮下面的程式碼:

public class LinkTest {
	public static void main(String[] args) {
		ToBeLinked toBeLinked = null;
		System.out.println("Test link.");
	}
}

類LinkTest 引用了類 ToBeLinked,但是並沒有真正使用它,只是宣告瞭一個變數,並沒有建立該類的例項或是訪問其中的靜態域。

在 Oracle 的 JDK 6 中,如果把編譯好的 ToBeLinked 的 Java 位元組程式碼刪除之後,再執行 LinkTest,程式不會丟擲錯誤。這是因為 ToBeLinked 類沒有被真正用到,而 Oracle 的 JDK 6 所採用的連結策略使得ToBeLinked 類不會被載入,因此也不會發現 ToBeLinked 的 Java 位元組程式碼實際上是不存在的。如果把程式碼改成 ToBeLinked toBeLinked = new ToBeLinked();之後,再按照相同的方法執行,就會丟擲異常了。因為這個時候 ToBeLinked 這個類被真正使用到了,會需要載入這個類。

Java 類的初始化

當一個 Java 類第一次被真正使用到的時候,JVM 會進行該類的初始化操作。初始化過程的主要操作是執行靜態程式碼塊和初始化靜態域。在一個類被初始化之前,它的直接父類也需要被初始化。但是,一個介面的初始化,不會引起其父介面的初始化。在初始化的時候,會按照原始碼中從上到下的順序依次執行靜態程式碼塊和初始化靜態域。考慮下面的程式碼:

public class StaticTest {
	public static int X = 10;
	public static void main(String[] args) {
		System.out.println(Y); //輸出60
	}
	static {
		X = 30;
	}
	public static int Y = X * 2;
}

在上面的程式碼中,在初始化的時候,靜態域的初始化和靜態程式碼塊的執行會從上到下依次執行。因此變數 X 的值首先初始化成 10,後來又被賦值成 30;而變數 Y 的值則被初始化成 60。

Java類和介面的初始化時機

Java 類和介面的初始化只有在特定的時機才會發生,這些時機包括:

  • 建立一個 Java 類的例項。如
MyClass obj = new MyClass()
  • 呼叫一個 Java 類中的靜態方法。如
MyClass.sayHello()
  • 給 Java 類或介面中宣告的靜態域賦值。如
MyClass.value = 10
  • 訪問 Java 類或介面中宣告的靜態域,並且該域不是常值變數。如
int value = MyClass.value
  • 在頂層 Java 類中執行 assert 語句。
assert true;

通過 Java 反射 API 也可能造成類和介面的初始化。需要注意的是,當訪問一個 Java類或介面中的靜態域的時候,只有真正宣告這個域的類或介面才會被初始化。如下面的程式碼所示。

package io.mykit.binghe.test;
 
class B {
	static int value = 100;
	static {
		System.out.println("Class B is initialized."); // 輸出
	}
}
 
class A extends B {
	static {
		System.out.println("Class A is initialized."); // 不會輸出
	}
}
 
public class InitTest {
	public static void main(String[] args) {
		System.out.println(A.value); // 輸出100
	}
}

在上述程式碼中,類 InitTest 通過 A.value 引用了類 B 中宣告的靜態域 value。由於 value是在類 B 中宣告的,只有類 B 會被初始化,而類 A 則不會被初始化。

建立自己的類載入器

在 Java 應用開發過程中,可能會需要建立應用自己的類載入器。典型的場景包括實現特定的 Java 位元組程式碼查詢方式、對位元組程式碼進行加密/解密以及實現同名 Java 類的隔離等 。建立 自己的 類載入 器並不 是 一件複雜 的事情 ,只需要繼承自java.lang.ClassLoader 類並覆寫對應的方法即可。 java.lang.ClassLoader 中提供的方法有不少,下面介紹幾個建立類載入器時需要考慮的:

  • defineClass():這個方法用來完成從Java位元組程式碼的位元組陣列到java.lang.Class的轉換。這個方法是不能被覆寫的,一般是用原生程式碼來實現的。
  • findLoadedClass():這個方法用來根據名稱查詢已經載入過的Java類。一個類載入器不會重複載入同一名稱的類。
  • findClass():這個方法用來根據名稱查詢並載入Java類。
  • loadClass():這個方法用來根據名稱載入Java類。
  • resolveClass():這個方法用來連結一個Java類。

這裡比較 容易混淆的是 findClass()方法和 loadClass()方法的作用。前面提到過,在Java 類的連結過程中,會需要對 Java 類進行解析,而解析可能會導致當前 Java 類所引用的其它 Java 類被載入。在這個時候,JVM 就是通過呼叫當前類的定義類載入器的 loadClass()方法來載入其它類的。 findClass()方法則是應用建立的類載入器的擴充套件點。應用自己的類載入器應該覆寫 findClass()方法來新增自定義的類載入邏輯。loadClass()方法的預設實現會負責呼叫 findClass()方法。前面提到,類載入器的代理模式預設使用的是父類優先的策略。這個策略的實現是封裝在 loadClass()方法中的。如果希望修改此策略,就需要覆寫 loadClass()方法。

下面的程式碼給出了自定義的類載入的常見實現模式

public class MyClassLoader extends ClassLoader {
	protected Class<?> findClass(String name) throws ClassNotFoundException {
		byte[] b = null; //查詢或生成Java類的位元組程式碼
		return defineClass(name, b, 0, b.length);
	}
}

好了,今天就到這兒吧,我是冰河,我們下期見!!

重磅福利

微信搜一搜【冰河技術】微信公眾號,關注這個有深度的程式設計師,每天閱讀超硬核技術乾貨,公眾號內回覆【PDF】有我準備的一線大廠面試資料和我原創的超硬核PDF技術文件,以及我為大家精心準備的多套簡歷模板(不斷更新中),希望大家都能找到心儀的工作,學習是一條時而鬱鬱寡歡,時而開懷大笑的路,加油。如果你通過努力成功進入到了心儀的公司,一定不要懈怠放鬆,職場成長和新技術學習一樣,不進則退。如果有幸我們江湖再見!

另外,我開源的各個PDF,後續我都會持續更新和維護,感謝大家長期以來對冰河的支援!!

相關文章