C++中extern “C”含義深層探索 (轉載)

gaoyj1973發表於2009-02-22

(轉載)C++中extern “C”含義深層探索


1.引言

  C++語言的建立初衷是“a better C”,但是這並不意味著C++中類似C語言的全域性變數和函式所採用的編譯和連線方式與C語言完全相同。作為一種欲與C相容的語言,C++保留了一部分過程式語言的特點(被世人稱為“不徹底地物件導向”),因而它可以定義不屬於任何類的全域性變數和函式。但是,C++畢竟是一種物件導向的程式設計語言,為了支援函式的過載,C++對全域性函式的處理方式與C有明顯的不同。
  2.從標準標頭檔案說起

  某企業曾經給出如下的一道面試題:

  面試題
  為什麼標準標頭檔案都有類似以下的結構?


#ifndef __INCvxWorksh
#define __INCvxWorksh
#ifdef __cplusplus
extern "C" {
#endif
/*...*/
#ifdef __cplusplus
}
#endif
#endif /* __INCvxWorksh */


  分析
  顯然,標頭檔案中的編譯宏“#ifndef __INCvxWorksh、#define __INCvxWorksh、#endif” 的作用是防止該標頭檔案被重複引用。

  那麼

#ifdef __cplusplus
extern "C" {
#endif
#ifdef __cplusplus
}
#endif


  的作用又是什麼呢?我們將在下文一一道來。

  3.深層揭密extern "C"

  extern "C" 包含雙重含義,從字面上即可得到:首先,被它修飾的目標是“extern”的;其次,被它修飾的目標是“C”的。讓我們來詳細解讀這兩重含義。

  被extern "C"限定的函式或變數是extern型別的;

  extern是C/C++語言中表明函式和全域性變數作用範圍(可見性)的關鍵字,該關鍵字告訴編譯器,其宣告的函式和變數可以在本模組或其它模組中使用。記住,下列語句:

  extern int a;


  僅僅是一個變數的宣告,其並不是在定義變數a,並未為a分配記憶體空間。變數a在所有模組中作為一種全域性變數只能被定義一次,否則會出現連線錯誤。

  通常,在模組的標頭檔案中對本模組提供給其它模組引用的函式和全域性變數以關鍵字extern宣告。例如,如果模組B欲引用該模組A中定義的全域性變數和函式時只需包含模組A的標頭檔案即可。這樣,模組B中呼叫模組A中的函式時,在編譯階段,模組B雖然找不到該函式,但是並不會報錯;它會在連線階段中從模組A編譯生成的目的碼中找到此函式。

  與extern對應的關鍵字是static,被它修飾的全域性變數和函式只能在本模組中使用。因此,一個函式或變數只可能被本模組使用時,其不可能被extern “C”修飾。

  被extern "C"修飾的變數和函式是按照C語言方式編譯和連線的;

  未加extern “C”宣告時的編譯方式

  首先看看C++中對類似C的函式是怎樣編譯的。

  作為一種物件導向的語言,C++支援函式過載,而過程式語言C則不支援。函式被C++編譯後在符號庫中的名字與C語言的不同。例如,假設某個函式的原型為:

void foo( int x, int y );


  該函式被C編譯器編譯後在符號庫中的名字為_foo,而C++編譯器則會產生像_foo_int_int之類的名字(不同的編譯器可能生成的名字不同,但是都採用了相同的機制,生成的新名字稱為“mangled name”)。

  _foo_int_int這樣的名字包含了函式名、函式引數數量及型別資訊,C++就是靠這種機制來實現函式過載的。例如,在C++中,函式void foo( int x, int y )與void foo( int x, float y )編譯生成的符號是不相同的,後者為_foo_int_float。
  同樣地,C++中的變數除支援區域性變數外,還支援類成員變數和全域性變數。使用者所編寫程式的類成員變數可能與全域性變數同名,我們以"."來區分。而本質上,編譯器在進行編譯時,與函式的處理相似,也為類中的變數取了一個獨一無二的名字,這個名字與使用者程式中同名的全域性變數名字不同。

  未加extern "C"宣告時的連線方式

  假設在C++中,模組A的標頭檔案如下:

// 模組A標頭檔案 moduleA.h
#ifndef MODULE_A_H
#define MODULE_A_H
int foo( int x, int y );
#endif


  在模組B中引用該函式:

// 模組B實現檔案 moduleB.cpp
#include "moduleA.h"
foo(2,3);


  實際上,在連線階段,聯結器會從模組A生成的目標檔案moduleA.obj中尋找_foo_int_int這樣的符號!

  加extern "C"宣告後的編譯和連線方式

  加extern "C"宣告後,模組A的標頭檔案變為:

// 模組A標頭檔案 moduleA.h
#ifndef MODULE_A_H
#define MODULE_A_H
extern "C" int foo( int x, int y );
#endif


  在模組B的實現檔案中仍然呼叫foo( 2,3 ),其結果是:

  (1)模組A編譯生成foo的目的碼時,沒有對其名字進行特殊處理,採用了C語言的方式;

  (2)聯結器在為模組B的目的碼尋找foo(2,3)呼叫時,尋找的是未經修改的符號名_foo。

  如果在模組A中函式宣告瞭foo為extern "C"型別,而模組B中包含的是extern int foo( int x, int y ) ,則模組B找不到模組A中的函式;反之亦然。

  所以,可以用一句話概括extern “C”這個宣告的真實目的(任何語言中的任何語法特性的誕生都不是隨意而為的,來源於真實世界的需求驅動。我們在思考問題時,不能只停留在這個語言是怎麼做的,還要問一問它為什麼要這麼做,動機是什麼,這樣我們可以更深入地理解許多問題):
  實現C++與C及其它語言的混合程式設計。
  明白了C++中extern "C"的設立動機,我們下面來具體分析extern "C"通常的使用技巧。
  4.extern "C"的慣用法

  (1)在C++中引用C語言中的函式和變數,在包含C語言標頭檔案(假設為cExample.h)時,需進行下列處理:

extern "C"
{
#include "cExample.h"
}


  而在C語言的標頭檔案中,對其外部函式只能指定為extern型別,C語言中不支援extern "C"宣告,在.c檔案中包含了extern "C"時會出現編譯語法錯誤。

  筆者編寫的C++引用C函式例子工程中包含的三個檔案的原始碼如下:

/* c語言標頭檔案:cExample.h */
#ifndef C_EXAMPLE_H
#define C_EXAMPLE_H
extern int add(int x,int y);
#endif
/* c語言實現檔案:cExample.c */
#include "cExample.h"
int add( int x, int y )
{
return x + y;
}
// c++實現檔案,呼叫add:cppFile.cpp
extern "C"
{
#include "cExample.h"
}
int main(int argc, char* argv[])
{
add(2,3);
return 0;
}


  如果C++呼叫一個C語言編寫的.DLL時,當包括.DLL的標頭檔案或宣告介面函式時,應加extern "C" { }。

  (2)在C中引用C++語言中的函式和變數時,C++的標頭檔案需新增extern "C",但是在C語言中不能直接引用宣告瞭extern "C"的該標頭檔案,應該僅將C檔案中將C++中定義的extern "C"函式宣告為extern型別。
  筆者編寫的C引用C++函式例子工程中包含的三個檔案的原始碼如下:

//C++標頭檔案 cppExample.h
#ifndef CPP_EXAMPLE_H
#define CPP_EXAMPLE_H
extern "C" int add( int x, int y );
#endif
//C++實現檔案 cppExample.cpp
#include "cppExample.h"
int add( int x, int y )
{
return x + y;
}
/* C實現檔案 cFile.c
/* 這樣會編譯出錯:#include "cExample.h" */
extern int add( int x, int y );
int main( int argc, char* argv[] )
{
add( 2, 3 );
return 0;
}


  如果深入理解了第3節中所闡述的extern "C"在編譯和連線階段發揮的作用,就能真正理解本節所闡述的從C++引用C函式和C引用C++函式的慣用法。對第4節給出的示例程式碼,需要特別留意各個細節。

[@more@]

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/267897/viewspace-1017721/,如需轉載,請註明出處,否則將追究法律責任。

相關文章