不要被 C++“自動生成”所矇騙

發表於2016-12-08

不要被C++“自動生成”所矇騙

C++物件可以使用兩種方式進行建立:建構函式和複製建構函式。假如我們定義了類A,並使用它建立物件。

物件ab使用編譯器提供的預設建構函式A::A()建立出來,我們稱這種建立方式為物件的定義(包含宣告的含義)。物件cd則是使用已有的物件,通過編譯器提供的複製建構函式A::A(const A&)建立,我們稱這種建立方式為物件的初始化(包含定義和宣告的含義)。

可能不少人會把物件的初始化和物件的賦值混淆,比如。

這裡把物件d賦值給物件c並非建立新的物件,它不會呼叫任何建構函式。編譯器預設提供的賦值運算子過載函式const A&operator=(const A&)為該語句提供支援。

編譯器除了提供預設建構函式、複製建構函式和賦值運算子過載函式之外,有可能還為我們提供了解構函式A::~A(),但是這裡的解構函式並不是virtual的(相信會有童鞋忘記這一點)。

這些基礎的語法對學習過C++的人或許並不陌生,我們自從學習了物件導向C++後,一直都知道編譯器為我們提供了這樣的便利條件。經過多年的程式設計實踐和體驗,我們絕對相信編譯器的確為我們做了這些工作,因為我們沒有遇到過任何問題。甚至我們腦子中會預設形成一個概念——即使我定義了一個空類(類內什麼都沒有),編譯器依然會“乖乖的”為我們生成上邊所說的四個函式。

如果你真的形成了這種觀念的話,那麼恭喜你,因為你已經將C++基本規則運用的十分熟練了。同時遺憾的是你我都看到了冰山一角,編譯器的工作方式遠不像我們使用它的那樣。讀者可能會疑問,難道編譯器沒有生成這些函式嗎?答:要看你類的定義。那麼編譯器到底如何生成這些函式呢?和我一樣又好奇心的人都想一探究竟,而這些內容在《Inside The C++ Object Model》被詮釋的比較徹底。筆者也通過“借花獻佛”的方式將該書所描述的物件構造的內幕結合個人的理解和大家一起分享。

首先我們從最簡單的談起,編譯器為類生成建構函式了嗎?如果按照上邊描述的例子,只有一個空的類定義的話,我們可以肯定的說——沒有。對編譯器這樣的做法,我們不必感到驚訝。試想一個空的類——沒有資料成員,沒有成員函式,即使生成了建構函式又能做什麼呢?即便是生成了,也只是一個空建構函式而已。

它什麼也做不了,也什麼都不必做。更“悲劇”,它的出現不僅沒有任何積極意義,還會為編譯器和程式執行增加完全不必要的函式呼叫負擔。

既然如此,我們讓這個類再複雜一點,我們為它增加資料成員和成員函式,比如下邊這段程式碼(我們記它為例子1)。

即便如此,結果還是和上邊的一樣,不生成建構函式!因為沒有任何理由對var初始化,況且編譯器也不知道用什麼值給它初始化。

果然,在主函式內定義物件a後,沒有任何建構函式被呼叫。

有人可能會說用0初始化不行嗎?這只是我們的“一廂情願”而已。一個沒有初始化的變數本身的值就可以是不確定的,何必要生成一個沒有任何意義的初始化為0的語句呢。

編譯器到底怎樣才能生成建構函式呢?!或許你和我一樣有點“抓狂”了。不過現在還不是絕望的時候,因為編譯器需要我們給它一個“正當的理由”生成建構函式。有四個正當的理由,讓編譯器不得不生成建構函式,這裡一一介紹。

首先,我們修改一下var的型別。這裡假設它不是內建型別int,而是一個定義好的類B

修改一下資料成員的型別為自定義型別能影響編譯器的抉擇嗎?答:可能。這要看類B有沒有定義建構函式。讀者可能有點明白了,是的,如果B沒有定義建構函式(和這裡的A一個樣子),那麼編譯器仍然沒有理由生成建構函式——為B初始化什麼呢?反之,B一旦定義了預設建構函式B::B(),即便它是空的,編譯器就不得不為A建立預設建構函式了(這裡不考慮編譯器的深度優化)。因為A的物件需要用B的預設建構函式初始化它自己的成員var,雖然B的建構函式什麼也沒做。因為編譯器不能假定B的建構函式做了什麼樣的操作(極端一點:萬一修改了一個全域性變數了呢?),因此編譯器有絕對的必要生成A的建構函式,保證B型別的資料成員的建構函式正常執行。

轉到編譯器為A生成的建構函式處,我們發現了B的建構函式被呼叫的語句(選中行)。

當然,如果B提供了建構函式,但不是預設的建構函式,那麼必須要程式設計師介入為var初始化,否則編譯器就不客氣了——error

因此,編譯器生成預設建構函式的第一個正當理由是——類內資料成員是物件,並且該物件的類提供了一個預設建構函式

現在,我們回到例子1,這裡我們不修改var的型別,而是讓A繼承於另一個類C

我們都知道,在C++建構函式初始化語法中,建構函式會先初始化基類C,再初始化自身的資料成員或者物件。因此,這裡的問題和物件成員var類似。如果基類C沒有提供任何建構函式,那麼編譯器仍然不提供A的預設建構函式。如果C提供了預設建構函式,結果和前邊類似。

結果不出所料,編譯器為A生成了建構函式,並且呼叫了基類C定義的預設建構函式。同樣,若C沒有提供預設預設建構函式,而提供了其他建構函式,編譯是無法通過的。

這也是編譯器生成預設建構函式的第二個正當理由——類的基類提供了預設的建構函式

我們再次回到例子1,這次我們修改成員函式fun

我們把類A的成員函式fun修改為虛擬函式,再次看看是否產生了預設建構函式。

這次編譯器“毫不客氣”的為A生成了預設建構函式,雖然它沒有呼叫任何其他的建構函式!這是什麼原因呢?原來,C++為了實現多型機制,需要為類維護一個虛擬函式表(vftable),而每個該類的物件都儲存一個指向該虛擬函式表的一個指標(一般儲存在物件最開始的四個四節處,多型機制的實現這裡暫不介紹)。編譯器為A生成建構函式,其實不為別的,就為了保證它定義的物件都要正常初始化這個虛擬函式表的指標(vfptr)!

好了,因此我們得出編譯器生成預設建構函式的第三個正當理由——類內定義了虛擬函式。這裡可能還涉及一個更復雜點的情況:類內本身沒有定義虛擬函式,但是繼承了基類的虛擬函式。其實按照上述的原則,我們可以推理如下:基類既然定義了虛擬函式,那麼基類本身就需要生成預設建構函式初始化它本身的虛擬函式表指標。而基類一旦產生了預設建構函式,派生類就需要產生預設建構函式呼叫它。同時,如果讀者對多型機制瞭解清除的話,派生類在生成的預設建構函式內還會初始化一次這個虛擬函式表指標的。

最後,我們再次回到例子1,這次仍然讓A繼承於C,但是這次C是一個空類——什麼都沒有,也不會自動生成預設建構函式。但是A繼承C的方式要變化一下。

A虛繼承於C,這次又有什麼不同呢?

這次編譯器也生成了A的建構函式,並且初始化過程和虛擬函式時有點類似。細心觀察下發現,這次建構函式也初始化了一張表——vbtable。瞭解虛繼承機制的讀者應該不會陌生,這張表叫虛基類表,它記錄了類繼承的所有的虛基類子物件在本類定義的物件內的偏移位置(至於虛繼承機制的實現,我們以後詳細探討)。為了保證虛繼承機制的正確工作,物件必須在初始化階段維護一個指向該表的一個指標,稱為虛表指標(vbptr)。編譯器因為它提供A的預設建構函式的理由和虛擬函式時類似。

這樣,我們得出編譯器生成預設建構函式的第四個正當理由——類使用了虛繼承

到這裡,我們把編譯器為類生成預設建構函式的正當理由闡述完畢,相信大家應該對建構函式的生成時機有了一個大致的認識。這四種“正當理由”其實是編譯器不得不為類生成預設建構函式的理由,《Inside The C++ Object Model》裡稱這種理由為nontrival的(候sir翻譯的很彆扭,所以怎麼翻譯隨你啦)。除了這四種情況外,編譯器稱為trival的,也就是沒有必要為類生成預設建構函式。這裡討論的建構函式生成準則的內容是寫進C++Standard的,如此看來標準就是“貼合正常思維”的一套準則(簡單YY一下),其實本就是這樣,編譯器不應該為了一致化做一些沒有必要的工作。

通過對預設建構函式的討論,相信大家對複製建構函式、賦值運算子過載函式、解構函式的生成時機應該可以自動擴充套件了。沒錯,它們遵循著一個最根本的原則:只有編譯器不得不為這個類生成函式的時候(nontrival),編譯器才會真正的生成它

因此,正如標題所說,我們不要被C++語法中所描述的那些條條框框所“矇騙”了。的確,相信這些生成規則不會對我們的程式設計帶來多大的影響(不會產生錯誤),但是隻有了解它們的背後操作,我們才知道編譯器究竟為我們做了什麼,我們才知道如何使用C++才能讓它變得更有效率——比如消除不必要的構造和虛擬機器制等(如果可以的話)。相信本文對C++自動生成的內容的描述讓不少人認清物件建構函式產生的前因後果,希望本文對你有所幫助。

相關文章