C#之泛型詳解

青夜之衫發表於2017-12-05
什麼是泛型

我們在編寫程式時,經常遇到兩個模組的功能非常相似,只是一個是處理int資料,另一個是處理string資料,或者其他自定義的資料型別,但我們沒有辦法,只能分別寫多個方法處理每個資料型別,因為方法的引數型別不同。有沒有一種辦法,在方法中傳入通用的資料型別,這樣不就可以合併程式碼了嗎?泛型的出現就是專門解決這個問題的。讀完本篇文章,你會對泛型有更深的瞭解。

為什麼要使用泛型
為了瞭解這個問題,我們先看下面的程式碼,程式碼省略了一些內容,但功能是實現一個棧,這個棧只能處理int資料型別:

public class Stack

{

private int[] m_item;

public int Pop(){…}

public void Push(int item){…}

public Stack(int i)

{

this.m_item = new int[i];

}

}

上面程式碼執行的很好,但是,當我們需要一個棧來儲存string型別時,該怎麼辦呢?很多人都會想到把上面的程式碼複製一份,把int改成string不就行了。當然,這樣做本身是沒有任何問題的,但一個優秀的程式是不會這樣做的,因為他想到若以後再需要long、Node型別的棧該怎樣做呢?還要再複製嗎?優秀的程式設計師會想到用一個通用的資料型別object來實現這個棧:

public class Stack

{

private object[] m_item;

public object Pop(){…}

public void Push(object item){…}

public Stack(int i)

{

this.m_item = new[i];

}

}

這個棧寫的不錯,他非常靈活,可以接收任何資料型別,可以說是一勞永逸。但全面地講,也不是沒有缺陷的,主要表現在:

當Stack處理值型別時,會出現裝箱、折箱操作,這將在託管堆上分配和回收大量的變數,若資料量大,則效能損失非常嚴重。
在處理引用型別時,雖然沒有裝箱和折箱操作,但將用到資料型別的強制轉換操作,增加處理器的負擔。
在資料型別的強制轉換上還有更嚴重的問題(假設stack是Stack的一個例項):
Node1 x = new Node1();

stack.Push(x);

Node2 y = (Node2)stack.Pop();

上面的程式碼在編譯時是完全沒問題的,但由於Push了一個Node1型別的資料,但在Pop時卻要求轉換為Node2型別,這將出現程式執行時的型別轉換異常,但卻逃離了編譯器的檢查。

針對object型別棧的問題,我們引入泛型,他可以優雅地解決這些問題。泛型用用一個通過的資料型別T來代替object,在類例項化時指定T的型別,執行時(Runtime)自動編譯為原生程式碼,執行效率和程式碼質量都有很大提高,並且保證資料型別安全。

使用泛型
下面是用泛型來重寫上面的棧,用一個通用的資料型別T來作為一個佔位符,等待在例項化時用一個實際的型別來代替。讓我們來看看泛型的威力:

public class Stack<T>

{

private T[] m_item;

public T Pop(){…}

public void Push(T item){…}

public Stack(int i)

{

this.m_item = new T[i];

}

}

類的寫法不變,只是引入了通用資料型別T就可以適用於任何資料型別,並且型別安全的。這個類的呼叫方法:

//例項化只能儲存int型別的類

Stack<int> a = new Stack<int>(100);

a.Push(10);

a.Push(“8888”); //這一行編譯不通過,因為類a只接收int型別的資料

int x = a.Pop();

//例項化只能儲存string型別的類

Stack<string> b = new Stack<string>(100);

b.Push(10); //這一行編譯不通過,因為類b只接收string型別的資料

b.Push(“8888”);

string y = b.Pop();

這個類和object實現的類有截然不同的區別:

1. 他是型別安全的。例項化了int型別的棧,就不能處理string型別的資料,其他資料型別也一樣。

2. 無需裝箱和折箱。這個類在例項化時,按照所傳入的資料型別生成原生程式碼,原生程式碼資料型別已確定,所以無需裝箱和折箱。

3. 無需型別轉換。

泛型類例項化的理論
C#泛型類在編譯時,先生成中間程式碼IL,通用型別T只是一個佔位符。在例項化類時,根據使用者指定的資料型別代替T並由即時編譯器(JIT)生成原生程式碼,這個原生程式碼中已經使用了實際的資料型別,等同於用實際型別寫的類,所以不同的封閉類的原生程式碼是不一樣的。按照這個原理,我們可以這樣認為:

泛型類的不同的封閉類是分別不同的資料型別。

例:Stack<int>和Stack<string>是兩個完全沒有任何關係的類,你可以把他看成類A和類B,這個解釋對泛型類的靜態成員的理解有很大幫助。

泛型類中資料型別的約束
程式設計師在編寫泛型類時,總是會對通用資料型別T進行有意或無意地有假想,也就是說這個T一般來說是不能適應所有型別,但怎樣限制呼叫者傳入的資料型別呢?這就需要對傳入的資料型別進行約束,約束的方式是指定T的祖先,即繼承的介面或類。因為C#的單根繼承性,所以約束可以有多個介面,但最多隻能有一個類,並且類必須在介面之前。這時就用到了C#2.0的新增關鍵字:

public class Node<T, V> where T : Stack, IComparable

where V: Stack

{…}

以上的泛型類的約束表明,T必須是從Stack和IComparable繼承,V必須是Stack或從Stack繼承,否則將無法通過編譯器的型別檢查,編譯失敗。

通用型別T沒有特指,但因為C#中所有的類都是從object繼承來,所以他在類Node的編寫中只能呼叫object類的方法,這給程式的編寫造成了困難。比如你的類設計只需要支援兩種資料型別int和string,並且在類中需要對T型別的變數比較大小,但這些卻無法實現,因為object是沒有比較大小的方法的。 瞭解決這個問題,只需對T進行IComparable約束,這時在類Node裡就可以對T的例項執行CompareTo方法了。這個問題可以擴充套件到其他使用者自定義的資料型別。

如果在類Node裡需要對T重新進行例項化該怎麼辦呢?因為類Node中不知道類T到底有哪些建構函式。為了解決這個問題,需要用到new約束:

public class Node<T, V> where T : Stack, new()

where V: IComparable

需要注意的是,new約束只能是無引數的,所以也要求相應的類Stack必須有一個無參建構函式,否則編譯失敗。

C#中資料型別有兩大類:引用型別和值型別。引用型別如所有的類,值型別一般是語言的最基本型別,如int, long, struct等,在泛型的約束中,我們也可以大範圍地限制型別T必須是引用型別或必須是值型別,分別對應的關鍵字是class和struct:

public class Node<T, V> where T : class

where V: struct

泛型方法
泛型不僅能作用在類上,也可單獨用在類的方法上,他可根據方法引數的型別自動適應各種引數,這樣的方法叫泛型方法。看下面的類:

public class Stack2

{

public void Push<T>(Stack<T> s, params T[] p)

{

foreach (T t in p)

{

s.Push(t);

}

}

}

原來的類Stack一次只能Push一個資料,這個類Stack2擴充套件了Stack的功能(當然也可以直接寫在Stack中),他可以一次把多個資料壓入Stack中。其中Push是一個泛型方法,這個方法的呼叫示例如下:

Stack<int> x = new Stack<int>(100);

Stack2 x2 = new Stack2();

x2.Push(x, 1, 2, 3, 4, 6);

string s = “”;

for (int i = 0; i < 5; i++)

{

s += x.Pop().ToString();

} //至此,s的值為64321

泛型中的靜態成員變數
在C#1.x中,我們知道類的靜態成員變數在不同的類例項間是共享的,並且他是通過類名訪問的。C#2.0中由於引進了泛型,導致靜態成員變數的機制出現了一些變化:靜態成員變數在相同封閉類間共享,不同的封閉類間不共享。

這也非常容易理解,因為不同的封閉類雖然有相同的類名稱,但由於分別傳入了不同的資料型別,他們是完全不同的類,比如:

Stack<int> a = new Stack<int>();

Stack<int> b = new Stack<int>();

Stack<long> c = new Stack<long>();

類例項a和b是同一型別,他們之間共享靜態成員變數,但類例項c卻是和a、b完全不同的型別,所以不能和a、b共享靜態成員變數。

泛型中的靜態建構函式
靜態建構函式的規則:只能有一個,且不能有引數,他只能被.NET執行時自動呼叫,而不能人工呼叫。

泛型中的靜態建構函式的原理和非泛型類是一樣的,只需把泛型中的不同的封閉類理解為不同的類即可。以下兩種情況可激發靜態的建構函式:

1. 特定的封閉類第一次被例項化。

2. 特定封閉類中任一靜態成員變數被呼叫。

泛型類中的方法過載
方法的過載在.Net Framework中被大量應用,他要求過載具有不同的簽名。在泛型類中,由於通用型別T在類編寫時並不確定,所以在過載時有些注意事項,這些事項我們通過以下的例子說明:

public class Node<T, V>

{

public T add(T a, V b) //第一個add

{

return a;

}

public T add(V a, T b) //第二個add

{

return b;

}

public int add(int a, int b) //第三個add

{

return a + b;

}

}

上面的類很明顯,如果T和V都傳入int的話,三個add方法將具有同樣的簽名,但這個類仍然能通過編譯,是否會引起呼叫混淆將在這個類例項化和呼叫add方法時判斷。請看下面呼叫程式碼:

Node<int, int> node = new Node<int, int>();

object x = node.add(2, 11);

這個Node的例項化引起了三個add具有同樣的簽名,但卻能呼叫成功,因為他優先匹配了第三個add。但如果刪除了第三個add,上面的呼叫程式碼則無法編譯通過,提示方法產生的混淆,因為執行時無法在第一個add和第二個add之間選擇。

Node<string, int> node = new Node<string, int>();

object x = node.add(2, “11”);

這兩行呼叫程式碼可正確編譯,因為傳入的string和int,使三個add具有不同的簽名,當然能找到唯一匹配的add方法。

由以上示例可知,C#的泛型是在例項的方法被呼叫時檢查過載是否產生混淆,而不是在泛型類本身編譯時檢查。同時還得出一個重要原則:

當一般方法與泛型方法具有相同的簽名時,會覆蓋泛型方法。

泛型類的方法重寫
方法重寫(override)的主要問題是方法簽名的識別規則,在這一點上他與方法過載一樣,請參考泛型類的方法過載。

泛型的使用範圍
本文主要是在類中講述泛型,實際上,泛型還可以用在類方法、介面、結構(struct)、委託等上面使用,使用方法大致相同,就不再講述。

小結
C# 泛型是開發工具庫中的一個無價之寶。它們可以提高效能、型別安全和質量,減少重複性的程式設計任務,簡化總體程式設計模型,而這一切都是通過優雅的、可讀性強的語法完成的。儘管 C# 泛型的根基是 C++ 模板,但 C# 通過提供編譯時安全和支援將泛型提高到了一個新水平。C# 利用了兩階段編譯、後設資料以及諸如約束和一般方法之類的創新性的概念。毫無疑問,C# 的將來版本將繼續發展泛型,以便新增新的功能,並且將泛型擴充套件到諸如資料訪問或本地化之類的其他 .NET Framework 領域。

本文轉自BlogJava 新浪blog的部落格,原文連結:C# 之泛型詳解,如需轉載請自行聯絡原博主。


相關文章