深入探索C++物件模型-(四)data語義學

coolwriter發表於2018-06-03

1. 在只有繼承沒有多型的情況下,子類是的內容就是父類加上子類特有的資料成員,例如,對於如下兩個類,Point2d和Point3d,後者公有繼承自前者,此時的資料佈局如下所示:


在某些情況下,把一個類分解成多層,可能會導致類所佔用空間的膨脹,例如,如下類,算上對齊操作大小為8 (4 + 1 + 1+1 +(1對齊)):


而如果相同的資料(val,c1,c2,c3),被分散的放入繼承體系之中,現在一個包含所有這些資料的類Concrete3的大小就膨脹到了16,這是因為上面的無繼承的類設計中,只有一個位元組被用來對齊,而此種繼承體系之下,有9個位元組被用來對齊:


這時的類的佈局如下:


為什麼不把Concrete2和Concrete3的資料填補到Concrete1用於對齊的空間中呢?原因時,在此種情況下,當發生Concrete1的複製操作時,會破壞Concrete2的內容:


2. 加入多型時的情況,例如,街上上述的例子,對於Point2d,現在加入幾個虛擬函式,用以支援多型特性:


此時會帶來額外的空間以及存取時間上的額外負擔:

a. 虛擬函式表會被產生出來(virtual table)。

b. 每一個類物件中會加入一個指向上述虛表的指標(vptr)。

c. 加強建構函式,使之可以為vptr設定初值。

d. 加強解構函式,使之可以清除指向虛擬函式表的vptr。

此時的類的記憶體佈局會增加一個指向虛表的指標(該指標可能放在頭部也可能放在尾部):


3. 多種繼承的情況,在單繼承中,可以看到,基類和子類的物件都是從相同的地址開始的,差異只是子類比較大,例如以下操作,

  1. P3d p3d;   
  2. P2d* p = &p3d;  

以基類指標指向子類指標並不需要修改地址,多重繼承則不一樣,因為第二個乃至後面的基類起始地址與對應基類的地址並不一樣,例如對於如下繼承體系以及對應的記憶體佈局:


從上圖看以看出,最左端基類(P2d和P3d)的起始地址和子類V3d是一樣的,而之後的基類Vertex則和子類不一致,因此,對於如下物件和指標:

  1. Vertex3d v3d;  
  2. Vertex* pv;  
  3. Point2d* p2d;  
  4. Point3d* p3d;  

如下的賦值操作:pv = v3d; 需要內部轉化為:pv = (Vertex*)(((char*)&v3d) + sizeof(Point3d));即需要偏移才可以指向子類中對應的該基類的部分,而對於如下賦值:p2d = &v3d;p3d = &v3d; 則不需要任何調整。

如果要存取第二個或者後繼基類中的一個資料成員,並不需要額外負擔,因為資料成員的位置在編譯時期就固定了,因此存取只是一個簡答的位移(offset)運算,並不需要額外成本。

4. 虛擬繼承的情況,考慮如下繼承體系,Vertex和Point3d虛擬繼承自Point2d,Vertex3d共有繼承(非虛繼承)自Vertex和Point3d


a. 此時必須有在子類物件中安插指標指向虛基類,一種可能的佈局如下,子類需要維護指向虛基類地址的指標,此種策略下,對於Point3d運算子:

  1. void Point3d::operator+=(const Point3d& rhs)  
  2. {  
  3.     _x += rhs._x;  
  4.     _y += rhs._y;  
  5.     _z += rhs._z;  
  6. };  
會內部轉化為:

  1. pPoint2d->_x += rhs.pPoint2d->_x;  
  2. pPoint2d->_y += rhs.pPoint2d->_y;  
  3. _z += rhs._z;  
而對於一個子類和基類的轉換:

  1. Point2d* p2d = pv3d; //Vertex3d* pv3d  

會被轉化為(必須判斷pv3d是否為空,否則可能導致不正確的賦值):

  1. Point2d* p2d = pv3d ? pv3d->pPoint2d : 0;  


b. 另一種策略是將虛基類的偏移量(而不是地址)存入虛表中(以下例子中,虛表中的正值索引會索引到虛擬函式地址,負值索引會索引到虛基類偏移量),也就是與虛擬函式放到一個表中,針對上例,此種策略下可能的佈局如下,此種策略下,上述+=運算子會被轉化為:

  1. (this + __vptr__Point3d[-1])->_x += (rhs + rhs.__vptr__Point3d[-1])->_x;  
  2. (this + __vptr__Point3d[-1])->_y += (rhs + rhs.__vptr__Point3d[-1])->_y;  
  3. _z += rhs._z;  
對於

  1. Point2d* p2d  = pv3d;  

會轉化為:

  1. Point2d* p2d  = pv3d ? pv3d + pv3d->__vptr__Point3d[-1] : 0;  

由於虛擬繼承的存在帶來了額外的負擔以及高度的複雜性,所以,一般而言,“虛基類的最有效的運用形式就是:一個抽象的虛基類,沒有任何資料成員。”


類B和類C通過虛繼承的方式派生自類A,這兩個物件的記憶體佈局中,編譯器在物件中新增了一個vbptr(virtual base pointer)指標,vbptr指向了一張表,這張表儲存了當前的虛指標相對於虛基類的首地址的偏移量。類D派生與類B和類C,繼承了兩個基類的vbptr指標,並調整了vbptr與虛基類的首地址的偏移量,使得這種菱形問題在繼承時只繼承一份資料,並且解決了二義性的問題。

當使用虛繼承時,虛基類是被共享的,也就是在繼承體系中無論被繼承多少次,物件記憶體模型中都只會出現一個虛基類的子物件。


1. 資料成員指標是指指向類資料成員的指標,其內容為對應資料成員在類物件中的偏移量,型別為A::*,例如,如下類:

  1. class Point3d {  
  2.     public:  
  3.         virtual ~Point3d();  
  4.     protected:  
  5.         static Point3d origin;  
  6.         float x, y, z;  
  7. };  
以下操作: &Point3d::z,將得到一個偏移值,其值最小為x和y大小的總和,或者是加上一個指標大小,這是因為類Point3d中存在虛擬函式,對應的類物件中就要有一個指向虛擬函式表的指標,該指標在類物件佈局中,可能放在最前端,此時x,y,z的偏移分別為:4,8,12,也可能放在最末端,此時x,y,z的偏移分別為:0,4,8,然而實際取出來的值卻並非是這樣,這個值總是比實際大一,即1,5,9類似(在VS2015中測試並沒有大一,猜測是編譯器做了優化),之所以需要大一,是為了區分一個沒有指向任何資料成員的指標和一個指向了第一個資料成員的指標,例如:

  1. float Point3d::*p1 = 0;  
  2. float Point3d::*p2 = &Point3d::x;  
注意取非靜態資料成員的地址(靜態資料成員不屬於具體的類物件,故沒有偏移量一說)和取繫結與真正類物件身上的資料成員的地址的區別,Point3d origin; &origin.z型別為float*而不是Point3d::*,相應的靜態成員的型別也為float*。

指向資料成員的指標的使用方法:

  1. float Point3d::*p2 = &Point3d::x;  
  2. Point3d point;  
  3. point.*p2 = 1//等價於point.x = 1  
  4. Point3d* p3d = &point;  
  5. p3d->*p2 = 2;//等價於p3d->x = 2  

2. 多重繼承的情況下,將第二個(或者後繼)基類指標與一個和子類物件繫結的資料成員結合起來時,情況會變得複雜,例如:


此種情況下,必須要考慮Base1存在導致的Base2的偏移,注意判零:func1(bmp ? bmp + sizeof(Base1) : 0, pd );


本文從5段程式碼例項出發。通過類中類的普通繼承,類的虛繼承,類的多重繼承,多個虛擬函式類的普通繼承、虛繼承與多重繼承,幾個交叉概念,具體的闡釋了繼承、虛擬函式與虛繼承的基本概念。深入剖析了繼承於虛繼承的差別於聯絡。

【Exp.001-虛繼承】

#include <stdio.h>

class A {
public:
    int a;
};//sizeof(A)=4

class B : virtual public A {
public:
  int b;
};//sizeof(B)=4(A副本)+4(虛表指標)+4(自己變數)=12

class C : virtual public B {     
};//sizeof(c)= 12(B副本)+4(虛表指標) = 16,假設這裡改為直接繼承,那麼sizeof(c)=12

int main() {
    printf("%d\n", sizeof(C));    
    return 0; 
}

解析:這裡須要理解虛繼承基類對派生類的空間大小的影響,理解虛指標在虛繼承中為子類帶來了哪些空間的改變。

【Exp.002-多重繼承】

#include <stdio.h>

class A {
public:
    int a;
};//sizeof(A) = 4

class B : virtual public A {
};// sizeof(B) =4+4=8

class C : virtual public A {        
};//sizeof(C) =4+4=8

class D : public B, public C{       
};
//sizeof(D)=8+8-4=12 這裡須要注意要減去4,由於B和C同一時候繼承A,僅僅須要儲存一個A的副本就好了,sizeof(D)=4(A的副本)+4(B的虛表)+4(C的虛表)=12

int main() {
    printf("%d\n", sizeof(D));
    return 0; 
}

解析:這裡須要關注 class D 的資料空間大小,理解多重虛繼承對派生類虛指標以及派生類空間的影響。

【Exp.003-普通繼承(含有:空類、虛擬函式)】

class A   
{   
};  

class B   
{
    char ch;   
    virtual void func0()  {  } 
}; 

class C  
{
    char ch1;
    char ch2;
    virtual void func()  {  }  
    virtual void func1()  {  } 
};

class D: public A, public C
{   
    int d;   
    virtual void func()  {  } 
    virtual void func1()  {  }
};   

class E: public B, public C
{   
    int e;   
    virtual void func0()  {  } 
    virtual void func1()  {  }
};

int main(void)
{
    cout<<"A="<<sizeof(A)<<endl;//result=1  空類所佔空間的大小為 1
    cout<<"B="<<sizeof(B)<<endl;//result=8  1+4   對齊 8 
    cout<<"C="<<sizeof(C)<<endl;//result=8  1+1+4 對齊 8
    cout<<"D="<<sizeof(D)<<endl;//result=12 C的副本+D本身=8+4=12
    cout<<"E="<<sizeof(E)<<endl;//result=20 B的副本+C的副本+E本身=8+8+4=20
    return 0;
}

這裡須要區分一下:

①沒有繼承的時候,存在虛擬函式則須要加上虛指標,假設有多個也僅僅須要加上一個,由於僅僅有一個虛指標;

②對於普通繼承,類D和類E中自己的虛擬函式,大小為0,由於,它沒有虛表。

③對於虛繼承中。派生類中存在一個或多個虛擬函式的時候,它本身就有一個虛表,指向自己的虛表,所以要加4。

【Exp.004-虛繼承(多重繼承和虛擬函式)】

class CommonBase
{
    int co;
};// size = 4

class Base1: virtual public CommonBase          
{
public:
    virtual void print1() {  }
    virtual void print2() {  }
private:
    int b1;
};//4副本+4虛指標+4自身+4(虛繼承+虛擬函式構成指標多一個)=16


class Base2: virtual public CommonBase        
{
public:
    virtual void dump1() {  }
    virtual void dump2() {  }
private:
    int b2;
};//同理16

class Derived: public Base1, public Base2     
{
public:
    void print2() {  }
    void dump2() {  }
private:
    int d;
};//16+16-4+4=32

解析:假設不是虛繼承的類。即便有虛擬函式也不會因此新增儲存空間,假設是虛繼承的類。沒有虛擬函式就加入一個虛指標空間,有虛擬函式不論多少個,就加入兩個虛指標空間。

【Exp.005-虛繼承與虛擬函式】

class A
{
public:
    virtual void aa() {  }
    virtual void aa2() {  }
private:
    char ch[3];
}; // 1+4 = 補齊 = 8

class B: virtual public A
{
public:
    virtual void bb() {  }
    virtual void bb2() {  }
}; // 8(副本)+4(虛繼承)+4(虛指標) = 16

int main(void)
{
    cout<<"A's size is "<<sizeof(A)<<endl;//        4+4=8
    cout<<"B's size is "<<sizeof(B)<<endl;//        A的副本+4+4=16
    return 0;
}

解析:假設不是虛繼承的類。即便有虛擬函式也不會因此新增儲存空間。假設是虛繼承的類。沒有虛擬函式就加入一個虛指標空間,有虛擬函式不論多少個,就加入兩個虛指標空間。

【小結】

重要的事情講三遍!!

假設不是虛繼承的類,即便有虛擬函式也不會因此新增儲存空間。假設是虛繼承的類。沒有虛擬函式就加入一個虛指標空間,有虛擬函式不論多少個。就加入兩個虛指標空間。。!



相關文章