c++實現多型的方法 虛表

sunmenggmail發表於2012-04-15

轉自:http://blog.csdn.net/jiangnanyouzi/article/details/3720807

1、c++實現多型的方法

其實很多人都知道,虛擬函式在c++中的實現機制就是用虛表和虛指標,但是具體是怎樣的呢?從more effecive c++其中一篇文章裡面可以知道:是每個類用了一個虛表,每個類的物件用了一個虛指標。具體的用法如下:

class A
{
public:
    virtual void f();
    virtual void g();
private:
    int a
};

class B : public A
{
public:
    void g();
private:
    int b;
};

//A,B的實現省略

因為A有virtual void f(),和g(),所以編譯器為A類準備了一個虛表vtableA,內容如下:

A::f 的地址
A::g 的地址

B因為繼承了A,所以編譯器也為B準備了一個虛表vtableB,內容如下:

A::f 的地址
B::g 的地址

注意:因為B::g是重寫了的,所以B的虛表的g放的是B::g的入口地址,但是f是從上面的A繼承下來的,所以f的地址是A::f的入口地址。

然後某處有語句 B bB;的時候,編譯器分配空間時,除了A的int a,B的成員int b;以外,還分配了一個虛指標vptr,指向B的虛表vtableB,bB的佈局如下:

vptr : 指向B的虛表vtableB
int a: 繼承A的成員
int b: B成員

當如下語句的時候:
A *pa = &bB;

pa的結構就是A的佈局(就是說用pa只能訪問的到bB物件的前兩項,訪問不到第三項int b)

那麼pa->g()中,編譯器知道的是,g是一個宣告為virtual的成員函式,而且其入口地址放在表格(無論是vtalbeA表還是vtalbeB表)的第2項,那麼編譯器編譯這條語句的時候就如是轉換:call *(pa->vptr)[1](C語言的陣列索引從0開始哈~)。

這一項放的是B::g()的入口地址,則就實現了多型。(注意bB的vptr指向的是B的虛表vtableB)

另外要注意的是,如上的實現並不是唯一的,C++標準只要求用這種機制實現多型,至於虛指標vptr到底放在一個物件佈局的哪裡,標準沒有要求,每個編譯器自己決定。我以上的結果是根據g++ 4.3.4經過反彙編分析出來的。

2、兩種多型實現機制及其優缺點

除了c++的這種多型的實現機制之外,還有另外一種實現機制,也是查表,不過是按名稱查表,是smalltalk等語言的實現機制。這兩種方法的優缺點如下:

(1)、按照絕對位置查表,這種方法由於編譯階段已經做好了索引和表項(如上面的call *(pa->vptr[1]) ),所以執行速度比較快;缺點是:當A的virtual成員比較多(比如1000個),而B重寫的成員比較少(比如2個),這種時候,B的vtableB的剩下的998個表項都是放A中的virtual成員函式的指標,如果這個派生體系比較大的時候,就浪費了很多的空間。

比如:GUI庫,以MFC庫為例,MFC有很多類,都是一個繼承體系;而且很多時候每個類只是1,2個成員函式需要在派生類重寫,如果用C++的虛擬函式機制,每個類有一個虛表,每個表裡面有大量的重複,就會造成空間利用率不高。於是MFC的訊息對映機制不用虛擬函式,而用第二種方法來實現多型,那就是:

(2)、按照函式名稱查表,這種方案可以避免如上的問題;但是由於要比較名稱,有時候要遍歷所有的繼承結構,時間效率效能不是很高。(關於MFC的訊息對映的實現,看下一篇文章)

3、總結:

如果繼承體系的基類的virtual成員不多,而且在派生類要重寫的部分佔了其中的大多數時候,用C++的虛擬函式機制是比較好的;

但是如果繼承體系的基類的virtual成員很多,或者是繼承體系比較龐大的時候,而且派生類中需要重寫的部分比較少,那就用名稱查詢表,這樣效率會高一些,很多的GUI庫都是這樣的,比如MFC,QT

PS. 其實,自從計算機出現之後,時間和空間就成了永恆的主題,因為兩者在98%的情況下都無法協調,此長彼消;這個就是電腦科學中的根本瓶頸之所在。軟體科學和演算法的發展,就看能不能突破這對時空權衡了。呵呵

何止電腦科學如此,整個宇宙又何嘗不是如此呢?最基本的宇宙之謎,還是時間和空間~



 C++的虛擬函式使用了一個虛擬函式表來存放了每一個虛擬函式的入口地址,這個虛擬函式表又使用一個虛擬函式指標來進行訪問。通常,虛擬函式指標都放在物件模型的第一個位置存放,這樣訪問徐函式指標的速度最快,沒有偏移量。通過虛擬函式指標,找到虛擬函式表,進而再做一個次偏移量計算,來得到真實虛擬函式的入口地址,從而訪問了虛擬函式。這樣看來,訪問一個虛擬函式將使用兩次間接計算,故要失去一些時間效率。另外,使用了虛擬函式,那麼就要消耗一些空間,存放虛擬函式指標。但是,這都是值得的,為了實現多型。

相關文章