Java 中泛型的全面解析

HollisChuang發表於2015-10-30

Java泛型(generics 是JDK 5中引入的一個新特性,允許在定義類和介面的時候使用型別引數(type parameter)。宣告的型別引數在使用時用具體的型別來替換。泛型最主要的應用是在JDK 5中的新集合類框架中。對於泛型概念的引入,開發社群的觀點是褒貶不一。從好的方面來說,泛型的引入可以解決之前的集合類框架在使用過程中通常會出現的執行時刻型別錯誤,因為編譯器可以在編譯時刻就發現很多明顯的錯誤。而從不好的地方來說,為了保證與舊有版本的相容性,Java泛型的實現上存在著一些不夠優雅的地方。當然這也是任何有歷史的程式語言所需要承擔的歷史包袱。後續的版本更新會為早期的設計缺陷所累。

開發人員在使用泛型的時候,很容易根據自己的直覺而犯一些錯誤。比如一個方法如果接收List<Object>作為形式引數,那麼如果嘗試將一個List<String>的物件作為實際引數傳進去,卻發現無法通過編譯。雖然從直覺上來說,Object是String的父類,這種型別轉換應該是合理的。但是實際上這會產生隱含的型別轉換問題,因此編譯器直接就禁止這樣的行為。本文試圖對Java泛型做一個概括性的說明。

型別擦除

正確理解泛型概念的首要前提是理解型別擦除type erasure)。

Java中的泛型基本上都是在編譯器這個層次來實現的。在生成的Java位元組程式碼中是不包含泛型中的型別資訊的。使用泛型的時候加上的型別引數,會被編譯器在編譯的時候去掉。這個過程就稱為型別擦除。如在程式碼中定義的List<Object>List<String>等型別,在編譯之後都會變成List。JVM看到的只是List,而由泛型附加的型別資訊對JVM來說是不可見的。Java編譯器會在編譯時儘可能的發現可能出錯的地方,但是仍然無法避免在執行時刻出現型別轉換異常的情況。型別擦除也是Java的泛型實現方式與C++模板機制實現方式之間的重要區別。 很多泛型的奇怪特性都與這個型別擦除的存在有關,包括:

泛型類並沒有自己獨有的Class類物件。比如並不存在List<String>.class或是List<Integer>.class,而只有List.class。 靜態變數是被泛型類的所有例項所共享的。對於宣告為MyClass<T>的類,訪問其中的靜態變數的方法仍然是 MyClass.myStaticVar。不管是通過new MyClass<String>;還是new MyClass<Integer>建立的物件,都是共享一個靜態變數。 泛型的型別引數不能用在Java異常處理的catch語句中。因為異常處理是由JVM在執行時刻來進行的。由於型別資訊被擦除,JVM是無法區分兩個異常型別MyException<String>;MyException<Integer>的。對於JVM來說,它們都是 MyException型別的。也就無法執行與異常對應的catch語句。

型別擦除的基本過程也比較簡單: 首先是找到用來替換型別引數的具體類。這個具體類一般是Object。如果指定了型別引數的上界的話,則使用這個上界。把程式碼中的型別引數都替換成具體的類。同時去掉出現的型別宣告,即去掉<>的內容。比如: T get()方法宣告就變成了Object get()List<String>就變成了List。 接下來就可能需要生成一些橋接方法(bridge method)。這是由於擦除了型別之後的類可能缺少某些必須的方法。比如考慮下面的程式碼:

當型別資訊被擦除之後,上述類的宣告變成了class MyString implements Comparable。但是這樣的話,類MyString就會有編譯錯誤,因為沒有實現介面Comparable宣告的int compareTo(Object)方法。這個時候就由編譯器來動態生成這個方法。

例項分析

瞭解了型別擦除機制之後,就會明白編譯器承擔了全部的型別檢查工作。編譯器禁止某些泛型的使用方式,正是為了確保型別的安全性。以上面提到的List<Object>List<String>為例來具體分析:

這段程式碼中,inspect方法接受List<Object>作為引數,當在test方法中試圖傳入List<String>的時候,會出現編譯錯誤。假設這樣的做法是允許的,那麼在inspect方法就可以通過list.add(1)來向集合中新增一個數字。這樣在test方法看來,其宣告為List<String>的集合中卻被新增了一個Integer型別的物件。這顯然是違反型別安全的原則的,在某個時候肯定會丟擲ClassCastException。因此,編譯器禁止這樣的行為。編譯器會盡可能的檢查可能存在的型別安全問題。對於確定是違反相關原則的地方,會給出編譯錯誤。當編譯器無法判斷型別的使用是否正確的時候,會給出警告資訊。

萬用字元與上下界

在使用泛型類的時候,既可以指定一個具體的型別,如List<String>就宣告瞭具體的型別是String;也可以用萬用字元?來表示未知型別,如List<?>就宣告瞭List中包含的元素型別是未知的。 萬用字元所代表的其實是一組型別,但具體的型別是未知的。List<?>所宣告的就是所有型別都是可以的。但是List<?>並不等同於List<Object>List<Object>實際上確定了List中包含的是Object及其子類,在使用的時候都可以通過Object來進行引用。而List<?>則其中所包含的元素型別是不確定。其中可能包含的是String,也可能是 Integer。如果它包含了String的話,往裡面新增Integer型別的元素就是錯誤的。正因為型別未知,就不能通過new ArrayList<?>()的方法來建立一個新的ArrayList物件。因為編譯器無法知道具體的型別是什麼。但是對於 List<?>中的元素確總是可以用Object來引用的,因為雖然型別未知,但肯定是Object及其子類。考慮下面的程式碼:

如上所示,試圖對一個帶萬用字元的泛型類進行操作的時候,總是會出現編譯錯誤。其原因在於萬用字元所表示的型別是未知的。

因為對於List<?>中的元素只能用Object來引用,在有些情況下不是很方便。在這些情況下,可以使用上下界來限制未知型別的範圍。 如List<? extends Number>說明List中可能包含的元素型別是Number及其子類。而List<? super Number>則說明List中包含的是Number及其父類。當引入了上界之後,在使用型別的時候就可以使用上界類中定義的方法。比如訪問 List<? extends Number>的時候,就可以使用Number類的intValue等方法。

型別系統

在Java中,大家比較熟悉的是通過繼承機制而產生的型別體系結構。比如String繼承自Object。根據Liskov替換原則,子類是可以替換父類的。當需要Object類的引用的時候,如果傳入一個String物件是沒有任何問題的。但是反過來的話,即用父類的引用替換子類引用的時候,就需要進行強制型別轉換。編譯器並不能保證執行時刻這種轉換一定是合法的。這種自動的子類替換父類的型別轉換機制,對於陣列也是適用的。 String[]可以替換Object[]。但是泛型的引入,對於這個型別系統產生了一定的影響。正如前面提到的List是不能替換掉List<Object>的。

引入泛型之後的型別系統增加了兩個維度:一個是型別引數自身的繼承體系結構,另外一個是泛型類或介面自身的繼承體系結構。第一個指的是對於 List<String>List<Object>這樣的情況,型別引數String是繼承自Object的。而第二種指的是 List介面繼承自Collection介面。對於這個型別系統,有如下的一些規則:

相同型別引數的泛型類的關係取決於泛型類自身的繼承體系結構。即List<String>Collection<String> 的子型別,List<String>可以替換Collection<String>。這種情況也適用於帶有上下界的型別宣告。 當泛型類的型別宣告中使用了萬用字元的時候, 其子型別可以在兩個維度上分別展開。如對Collection<? extends Number>來說,其子型別可以在Collection這個維度上展開,即List<? extends Number>Set<? extends Number>等;也可以在Number這個層次上展開,即Collection<Double>Collection<Integer>等。如此迴圈下去,ArrayList<Long>HashSet<Double>等也都算是Collection<? extends Number>的子型別。 如果泛型類中包含多個型別引數,則對於每個型別引數分別應用上面的規則。

理解了上面的規則之後,就可以很容易的修正例項分析中給出的程式碼了。只需要把List<Object>改成List<?>即可。List<String>List<?>的子型別,因此傳遞引數時不會發生錯誤。

開發自己的泛型類

泛型類與一般的Java類基本相同,只是在類和介面定義上多出來了用<>宣告的型別引數。一個類可以有多個型別引數,如 MyClass<X, Y, Z>。 每個型別引數在宣告的時候可以指定上界。所宣告的型別引數在Java類中可以像一般的型別一樣作為方法的引數和返回值,或是作為域和區域性變數的型別。但是由於型別擦除機制,型別引數並不能用來建立物件或是作為靜態變數的型別。考慮下面的泛型類中的正確和錯誤的用法。

總結

在使用泛型的時候可以遵循一些基本的原則,從而避免一些常見的問題。

在程式碼中避免泛型類和原始型別的混用(Effective Java中建議不要在程式碼中使用原始型別)。比如List和List不應該共同使用。這樣會產生一些編譯器警告和潛在的執行時異常。當需要利用JDK 5之前開發的遺留程式碼,而不得不這麼做時,也儘可能的隔離相關的程式碼。 在使用帶萬用字元的泛型類的時候,需要明確萬用字元所代表的一組型別的概念。由於具體的型別是未知的,很多操作是不允許的。 泛型類最好不要同陣列一塊使用。你只能建立new List<?>[10]這樣的陣列,無法建立new List[10]這樣的。這限制了陣列的使用能力,而且會帶來很多費解的問題。因此,當需要類似陣列的功能時候,使用集合類即可。 不要忽視編譯器給出的警告資訊。

參考資料:

相關文章