文章來源:http://blog.csdn.net/starboybenben/article/details/49803315
C語言(C++語言)中的巨集(Macro)屬於編譯器預處理的範疇,屬於編譯期概念(而非執行期概念)。下面對常遇到的巨集的使用問題做了簡單總結。
關 於#和##
在C語言的巨集中,#的功能是將其後面的巨集引數進行字串化操作(Stringfication),簡單說就是在對它所引用的巨集變數通過替換後在其左右各加上一個雙引號。比如下面程式碼中的巨集:
WARN_IF (divider == 0);
被替換為
fprintf(stderr, "Warning" "divider == 0" "\n");
} while(0);
struct command
{
char * name;
void (*function) (void);
};
struct command commands[] = {
COMMAND(quit),
COMMAND(help),
...
}
COMMAND巨集在這裡充當一個程式碼生成器的作用,這樣可以在一定程度上減少程式碼密度,間接地也可以減少不留心所造成的錯誤。我們還可以n個##符號連線 n+1個Token,這個特性也是#符號所不具備的。比如:
#define LINK_MULTIPLE(a,b,c,d) a##_##b##_##c##_##d
typedef struct _record_typeLINK_MULTIPLE(name,company,position,salary);
// 這裡這個語句將展開為:
#define myprintf(templt,...)fprintf(stderr,templt,__VA_ARGS__)
// 或者
#define myprintf(templt,args...) fprintf(stderr,templt,args)
第一個巨集中由於沒有對變參起名,我們用預設的巨集__VA_ARGS__來替代它。第二個巨集中,我們顯式地命名變參為args,那麼我們在巨集定義中就可以用args來代指變參了。同C語言的stdcall一樣,變參必須作為參數列的最有一項出現。當上面的巨集中我們只能提供第一個引數templt時,C標準要求我們必須寫成:
myprintf(templt,);
的 形式。這時的替換過程為:
myprintf("Error!\n",);
替換為:
fprintf(stderr,"Error!\n",);
這是一個語法錯誤,不能正常編譯。這個問題一般有 兩個解決方法。首先,GNU CPP提供的解決方法允許上面的巨集呼叫寫成:
myprintf(templt);
而它將會 被通過替換變成:
fprintf(stderr,"Error!\n",);
很明顯,這裡仍然會產生編譯錯誤(非本例的 某些情況下不會產生編譯錯誤)。除了這種方式外,c99和GNUCPP都支援下面的巨集定義方式:
#define myprintf(templt, ...) fprintf(stderr,templt,##__VAR_ARGS__)
這 時,##這個連線符號充當的作用就是當__VAR_ARGS__為空的時候,消除前面的那個逗號。那麼此時的翻譯過程如下:
myprintf(templt);
被轉化為:
fprintf(stderr,templt);
這樣如果templt合法,將不會產生 編譯錯誤。 這裡列出了一些巨集使用中容易出錯的地方,以及合適的使用方式。
錯誤的巢狀-Misnesting
巨集的定義不一定要有完整的、配對的括號,但是為了避免出錯並且提高可讀性,最好避免這樣使用。
由 操作符優先順序引起的問題-Operator Precedence Problem
由於巨集只是簡單的替換,巨集的引數如果是複合結構,那麼通過替換之後可能由於各個引數之間的操作符優先順序高於單個引數內部各部分之間相互作用的操作符優先順序,如果我們不用括號保護各個巨集引數,可能會產生預想不到的情形。比如:
#define ceil_div(x, y) (x + y - 1) / y
那麼
a = ceil_div( b & c, sizeof(int) );
將被轉化為:
a = ( b & c + sizeof(int) - 1) / sizeof(int);
// 由於+/-的優先順序高於&的優先順序,那麼上面式子等同於:
a = ( b & (c + sizeof(int) - 1)) /sizeof(int);
這顯然不是呼叫者的初衷。為了避免這種情況發生,應當多寫幾個括號:
#define ceil_div(x, y) (((x) + (y) - 1) / (y))
消除多餘的分號-Semicolon Swallowing
通常情況下,為了使函式模樣的巨集在表面上看起來像一個通常的C語言呼叫一樣,通常情況下我們在巨集的後面加上一個分號,比如下面的帶參巨集:
MY_MACRO(x);
但是如果是下面的情況:
#define MY_MACRO(x) { \
\
\
if (condition())
MY_MACRO(a);
else
{...}
這樣會由於多出的那個分號產生編譯錯誤。為了避免這種情況出現同時保持MY_MACRO(x);的這種寫法,我們需要把巨集定義為這種形式:
#define MY_MACRO(x) do {
\
\
} while(0)
這樣只要保證總是使用分號,就不會有任何問題。
Duplication of Side Effects
這裡的SideEffect是指巨集在展開的時候對其引數可能進行多次Evaluation(也就是取值),但是如果這個巨集引數是一個函式,那麼就有可能被呼叫多次從而達到不一致的結果,甚至會發生更嚴重的錯誤。比如:
#define min(X,Y) ((X) > (Y) ? (Y) : (X))
//...
c = min(a,foo(b));
這 時foo()函式就被呼叫了兩次。為了解決這個潛在的問題,我們應當這樣寫min(X,Y)這個巨集:
#define min(X,Y) ({ \
typeof (X) x_ = (X); \
typeof (Y) y_ = (Y); \
(x_ < y_) ? x_ : y_; })
({...})的作用是將內部的幾條語句中最後一條的值返回,它也允許在內部宣告變數(因為它通過大括號組成了一個區域性Scope)。
==
#define display(name) printf(""#name"")
int main() {
display(name);
}
執行結果是name,為什麼不是"#name"呢?
---------------------------------------------------------------
#在這裡是字串化的意思
printf(""#name"") 相當於
printf("" "name" "")
---------------------------------------------------------------
The number-sign or "stringizing" operator (#) converts macroparameters (after expansion) to string constants
---------------------------------------------------------------
printf("" #name "") <1>
相當於printf("" "name" "") <2>
而<2>中的第2,3個“中間時空格等價於("空+name+空')
---------------------------------------------------------------
## 連線符與# 符
##連線符號由兩個井號組成,其功能是在帶引數的巨集定義中將兩個子串(token)聯接起來,從而形成一個新的子串。但它不可以是第一個或者最後一個子串。所謂的子串(token)就是指編譯器能夠識別的最小語法單元。具體的定義在編譯原理裡有詳盡的解釋,但不知道也無所謂。同時值得注意的是#符是把傳遞過來的引數當成字串進行替代。下面來看看它們是怎樣工作的。這是MSDN上的一個例子。
假設程式中已經定義了這樣一個帶引數的巨集:
#define paster( n ) printf( "token" #n " = %d", token##n )
同時又定義了一個整形變 量:
int token9 = 9;
現在在主程式中以下面的方式呼叫這個巨集:
paster( 9 );
那 麼在編譯時,上面的這句話被擴充套件為:
printf( "token" "9" " = %d", token9 );
注意到在這個例子中,paster(9);中的這個”9”被原封不動的當成了一個字串,與”token”連線在了一起,從而成為了token9。而#n也被”9”所替代。
可想而知,上面程式執行的結果就是在螢幕上列印出token9=9
---------------------------------------------------------------
#define display(name) printf(""#name"")
int main() {
display(name);
}
====================================
特殊性就在 於它是個巨集,巨集裡面處理#號就如LS所說!
處理後就是一個附加的字串!
但printf(""#name"") ;就不行了!
---------------------------------------------------------------
#define display(name) printf(""#name"")
該定義 字串化name,得到結果其實就是 printf("name") (前後的空字串拿掉) 這樣輸出來的自然是 name。從另外一個角度講,#是一個連線符號,參與運算了, 自然不會輸出了。
在C語言的巨集中,#的功能是將其後面的巨集引數進行字串化操作(Stringfication),簡單說就是在對它所引用的巨集變數通過替換後在其左右各加上一個雙引號。比如下面程式碼中的巨集:
#define WARN_IF(EXP) \
do{ if (EXP) \
fprintf(stderr, "Warning: " #EXP "\n");
}while(0)
那麼實際使用中會出現下面所示的替換過程:WARN_IF (divider == 0);
被替換為
do {
if (divider == 0)fprintf(stderr, "Warning" "divider == 0" "\n");
} while(0);
這樣每次divider(除數)為0的時候便會在標 準錯誤流上輸出一個提示資訊。
而##被稱為連線符(concatenator),用來將兩個Token連線為一個Token。注意這裡連線的物件是Token就行,而不一定是巨集的變數。比如你要做一個選單項命令名和函式指標組成的結構體的陣列,並且希望在函式名和選單項命令名之間有直觀的、名字上的關係。那麼下面的程式碼就非常實用:struct command
{
char * name;
void (*function) (void);
};
#define COMMAND(NAME) { NAME, NAME ## _command }
// 然後你就用一些預先定義好的命令來方便的初始化一個command結構的陣列了:struct command commands[] = {
COMMAND(quit),
COMMAND(help),
...
}
COMMAND巨集在這裡充當一個程式碼生成器的作用,這樣可以在一定程度上減少程式碼密度,間接地也可以減少不留心所造成的錯誤。我們還可以n個##符號連線 n+1個Token,這個特性也是#符號所不具備的。比如:
#define LINK_MULTIPLE(a,b,c,d) a##_##b##_##c##_##d
typedef struct _record_typeLINK_MULTIPLE(name,company,position,salary);
// 這裡這個語句將展開為:
// typedef struct _record_type name_company_position_salary;
關於...的使用
...在C巨集中稱為Variadic Macro,也就是變參巨集。比如:#define myprintf(templt,...)fprintf(stderr,templt,__VA_ARGS__)
// 或者
#define myprintf(templt,args...) fprintf(stderr,templt,args)
第一個巨集中由於沒有對變參起名,我們用預設的巨集__VA_ARGS__來替代它。第二個巨集中,我們顯式地命名變參為args,那麼我們在巨集定義中就可以用args來代指變參了。同C語言的stdcall一樣,變參必須作為參數列的最有一項出現。當上面的巨集中我們只能提供第一個引數templt時,C標準要求我們必須寫成:
myprintf(templt,);
的 形式。這時的替換過程為:
myprintf("Error!\n",);
替換為:
fprintf(stderr,"Error!\n",);
這是一個語法錯誤,不能正常編譯。這個問題一般有 兩個解決方法。首先,GNU CPP提供的解決方法允許上面的巨集呼叫寫成:
myprintf(templt);
而它將會 被通過替換變成:
fprintf(stderr,"Error!\n",);
很明顯,這裡仍然會產生編譯錯誤(非本例的 某些情況下不會產生編譯錯誤)。除了這種方式外,c99和GNUCPP都支援下面的巨集定義方式:
#define myprintf(templt, ...) fprintf(stderr,templt,##__VAR_ARGS__)
這 時,##這個連線符號充當的作用就是當__VAR_ARGS__為空的時候,消除前面的那個逗號。那麼此時的翻譯過程如下:
myprintf(templt);
被轉化為:
fprintf(stderr,templt);
這樣如果templt合法,將不會產生 編譯錯誤。 這裡列出了一些巨集使用中容易出錯的地方,以及合適的使用方式。
錯誤的巢狀-Misnesting
巨集的定義不一定要有完整的、配對的括號,但是為了避免出錯並且提高可讀性,最好避免這樣使用。
由 操作符優先順序引起的問題-Operator Precedence Problem
由於巨集只是簡單的替換,巨集的引數如果是複合結構,那麼通過替換之後可能由於各個引數之間的操作符優先順序高於單個引數內部各部分之間相互作用的操作符優先順序,如果我們不用括號保護各個巨集引數,可能會產生預想不到的情形。比如:
#define ceil_div(x, y) (x + y - 1) / y
那麼
a = ceil_div( b & c, sizeof(int) );
將被轉化為:
a = ( b & c + sizeof(int) - 1) / sizeof(int);
// 由於+/-的優先順序高於&的優先順序,那麼上面式子等同於:
a = ( b & (c + sizeof(int) - 1)) /sizeof(int);
這顯然不是呼叫者的初衷。為了避免這種情況發生,應當多寫幾個括號:
#define ceil_div(x, y) (((x) + (y) - 1) / (y))
消除多餘的分號-Semicolon Swallowing
通常情況下,為了使函式模樣的巨集在表面上看起來像一個通常的C語言呼叫一樣,通常情況下我們在巨集的後面加上一個分號,比如下面的帶參巨集:
MY_MACRO(x);
但是如果是下面的情況:
#define MY_MACRO(x) { \
\
\
}
//...
if (condition())
MY_MACRO(a);
else
{...}
這樣會由於多出的那個分號產生編譯錯誤。為了避免這種情況出現同時保持MY_MACRO(x);的這種寫法,我們需要把巨集定義為這種形式:
#define MY_MACRO(x) do {
\
\
} while(0)
這樣只要保證總是使用分號,就不會有任何問題。
Duplication of Side Effects
這裡的SideEffect是指巨集在展開的時候對其引數可能進行多次Evaluation(也就是取值),但是如果這個巨集引數是一個函式,那麼就有可能被呼叫多次從而達到不一致的結果,甚至會發生更嚴重的錯誤。比如:
#define min(X,Y) ((X) > (Y) ? (Y) : (X))
//...
c = min(a,foo(b));
這 時foo()函式就被呼叫了兩次。為了解決這個潛在的問題,我們應當這樣寫min(X,Y)這個巨集:
#define min(X,Y) ({ \
typeof (X) x_ = (X); \
typeof (Y) y_ = (Y); \
(x_ < y_) ? x_ : y_; })
({...})的作用是將內部的幾條語句中最後一條的值返回,它也允許在內部宣告變數(因為它通過大括號組成了一個區域性Scope)。
==
#define display(name) printf(""#name"")
int main() {
display(name);
}
執行結果是name,為什麼不是"#name"呢?
---------------------------------------------------------------
#在這裡是字串化的意思
printf(""#name"") 相當於
printf("" "name" "")
---------------------------------------------------------------
The number-sign or "stringizing" operator (#) converts macroparameters (after expansion) to string constants
---------------------------------------------------------------
printf("" #name "") <1>
相當於printf("" "name" "") <2>
而<2>中的第2,3個“中間時空格等價於("空+name+空')
---------------------------------------------------------------
## 連線符與# 符
##連線符號由兩個井號組成,其功能是在帶引數的巨集定義中將兩個子串(token)聯接起來,從而形成一個新的子串。但它不可以是第一個或者最後一個子串。所謂的子串(token)就是指編譯器能夠識別的最小語法單元。具體的定義在編譯原理裡有詳盡的解釋,但不知道也無所謂。同時值得注意的是#符是把傳遞過來的引數當成字串進行替代。下面來看看它們是怎樣工作的。這是MSDN上的一個例子。
假設程式中已經定義了這樣一個帶引數的巨集:
#define paster( n ) printf( "token" #n " = %d", token##n )
同時又定義了一個整形變 量:
int token9 = 9;
現在在主程式中以下面的方式呼叫這個巨集:
paster( 9 );
那 麼在編譯時,上面的這句話被擴充套件為:
printf( "token" "9" " = %d", token9 );
注意到在這個例子中,paster(9);中的這個”9”被原封不動的當成了一個字串,與”token”連線在了一起,從而成為了token9。而#n也被”9”所替代。
可想而知,上面程式執行的結果就是在螢幕上列印出token9=9
---------------------------------------------------------------
#define display(name) printf(""#name"")
int main() {
display(name);
}
====================================
特殊性就在 於它是個巨集,巨集裡面處理#號就如LS所說!
處理後就是一個附加的字串!
但printf(""#name"") ;就不行了!
---------------------------------------------------------------
#define display(name) printf(""#name"")
該定義 字串化name,得到結果其實就是 printf("name") (前後的空字串拿掉) 這樣輸出來的自然是 name。從另外一個角度講,#是一個連線符號,參與運算了, 自然不會輸出了。