看完這些問題後，你還會說自己懂 C 語言麼？

xxmen發表於2015-10-12

這篇文章的目的是讓每個程式設計師（特別是 C 程式設計師）說：我真的不懂 C。我想要讓大家看到 C 語言的那些陰暗角落比我們想象中更近，甚至那些平常的程式碼中就包含著未定義的行為。

這篇文章設定了一系列的問題和答案。所有的例子都是從原始碼中單獨分離出來的。

int i;
int i = 10;

1 2	int i; int i = 10;

Q：這段程式碼正確嗎？是否會因為變數被定義了兩次而導致錯誤的出現？注意這是源於同一個原始碼檔案，而不是函式體或程式碼段的一部分。

A：是的，這段程式碼是正確的。第一行是臨時的定義直到編譯器處理了第二行的定義之後才成為正式的“定義”。

extern void bar(void);
void foo(int *x)
{
  int y = *x;  /* (1) */
  if(!x)       /* (2) */
  {
    return;    /* (3) */
  }
  bar();
  return;
}

extern void bar(void);

void foo(int *x)

{

int y = *x; /* (1) */

if(!x) /* (2) */

{

return; /* (3) */

}

bar();

return;

}

Q: 這樣寫的結果是即使 x 是空指標 bar() 函式都會被呼叫，並且程式不會崩潰。這是否是優化器的錯誤，或者全部是正確的？

A: 全部都是正確的。如果 x 是空指標，未定義的行為出現在第 (1) 行，沒有人欠程式設計師什麼，所以程式並不會在第 (1) 行崩潰，也不會試圖在第 (2) 行返回假如已經成功執行第 (1) 行。讓我們來探討編譯器遵循的規則，它都按如下的方式進行。在對第 (1) 行的分析之後，編譯器認為 x 不會是一個空指標，於是第 (2) 行和第 (3) 行就被認定為是沒用的程式碼。變數 y 被當做沒用的變數去除。從記憶體中讀取的操作也會被去除，因為 *x 並不符合易變型別（volatile）。

這就是無用的變數如何導致空指標檢查失效的例子。

3.有這樣一個函式：

#define ZP_COUNT 10
void func_original(int *xp, int *yp, int *zp)
{
  int i;
  for(i = 0; i < ZP_COUNT; i++)
  {
    *zp++ = *xp + *yp;
  }
}

#define ZP_COUNT 10

void func_original(int *xp, int *yp, int *zp)

{

int i;

for(i = 0; i < ZP_COUNT; i++)

{

*zp++ = *xp + *yp;

}

有人想要按如下方式來優化它：

void func_optimized(int *xp, int *yp, int *zp)
{
  int tmp = *xp + *yp;
  int i;
  for(i = 0; i < ZP_COUNT; i++)
  {
    *zp++ = tmp;
  }
}

void func_optimized(int *xp, int *yp, int *zp)

{

int tmp = *xp + *yp;

int i;

for(i = 0; i < ZP_COUNT; i++)

{

*zp++ = tmp;

}

Q：呼叫原始的函式和呼叫優化後的函式，對於變數 zp 是否有可能獲得不同的結果?

A：這是可能的，當 yp == zp 時結果就不同。

double f(double x)
{
  assert(x != 0.);
  return 1. / x;
}

double f(double x)

{

assert(x != 0.);

return 1. / x;

}

Q: 這個函式是否可能返回最大下界（inf）？假設浮點數運算是按照IEEE 754 標準（大部分機器遵循）執行的，並且斷言語句是可用的（NDEBUG 並沒有被定義）。

A：是的，這是可以的。通過傳入一個非規範化的 x 的值，比如 1e-309.

int my_strlen(const char *x)
{
  int res = 0;
  while(*x)
  {
    res++;
    x++;
  }
  return res;
}

int my_strlen(const char *x)

{

int res = 0;

while(*x)

{

res++;

x++;

}

return res;

}

Q: 上面提供的函式應該返回以空終止字元結尾的字串長度，找出其中存在的一個 bug 。

A: 使用 int 型別來儲存物件的大小是錯誤的，因為無法保證 int 型別能夠存下任何物件的大小，應該使用 size_t。

#include <stdio.h>
#include <string.h>
int main()
{
  const char *str = "hello";
  size_t length = strlen(str);
  size_t i;
  for(i = length - 1; i >= 0; i--)
  {
    putchar(str[i]);
  }
  putchar('n');
  return 0;
}

#include <stdio.h>

#include <string.h>

int main()

{

const char *str = "hello";

size_t length = strlen(str);

size_t i;

for(i = length - 1; i >= 0; i--)

{

putchar(str[i]);

}

putchar('n');

return 0;

}

Q: 這個迴圈是死迴圈。這是為什麼？

A: size_t 是無符號型別。如果 i 是無符號型別，那麼 i >= 0 永遠都是正確的。

#include <stdio.h>
void f(int *i, long *l)
{
  printf("1. v=%ldn", *l); /* (1) */
  *i = 11;                  /* (2) */
  printf("2. v=%ldn", *l); /* (3) */
}
int main()
{
  long a = 10;
  f((int *) &a, &a);
  printf("3. v=%ldn", a);
  return 0;
}

#include <stdio.h>

void f(int *i, long *l)

{

printf("1. v=%ldn", *l); /* (1) */

*i = 11; /* (2) */

printf("2. v=%ldn", *l); /* (3) */

}

int main()

{

long a = 10;

f((int *) &a, &a);

printf("3. v=%ldn", a);

return 0;

}

這個程式分別用兩個不同的編譯器編譯並且在一臺小位元組序的機器上執行。獲得瞭如下兩種不同的結果：

1. v=10    2. v=11    3. v=11
1. v=10    2. v=10    3. v=11

1 2	1. v=10 2. v=11 3. v=11 1. v=10 2. v=10 3. v=11

Q：你如何解釋第二種結果？

A：所給程式存在未定義的行為。程式違反了編譯器的強重疊規則（strict aliasing）。雖然 int 在第 (2) 行被改變了，但是編譯器可以假設任何的 long 都沒有改變。我們不能間接引用那些和其他不相容型別指標相重名的指標。這就是編譯器之所以可以傳遞和在第一行的執行過程中被讀取的相同的 long (第(3)行)的原因。

#include <stdio.h>
int main()
{
  int array[] = { 0, 1, 2 };
  printf("%d %d %dn", 10, (5, array[1, 2]), 10);
}

#include <stdio.h>

int main()

{

int array[] = { 0, 1, 2 };

printf("%d %d %dn", 10, (5, array[1, 2]), 10);

}

Q: 這個程式碼是否是正確的？如果不存在未定義行為，那麼它會輸出什麼？

A: 是的，這裡使用了逗號運算子。首先，逗號左邊的引數被計算後丟棄，然後，右邊的引數經過計算後被當做整個運算子的值使用，所以輸出是 10 2 10。

注意在函式呼叫中的逗號符號（比如 f(a(), b())）並不是逗號運算子，因此也就不會保證運算的順序，a() 和 b() 會以隨機的順序計算。

unsigned int add(unsigned int a, unsigned int b)
{
  return a + b;
}

unsigned int add(unsigned int a, unsigned int b)

{

return a + b;

}

Q: 函式 add(UINT_MAX, 1) 的結果是什麼？

A：對於無符號數的溢位結果是有定義的，結果是 2^(CHAR_BIT * sizeof(unsigned int)) ，所以函式 add 的結果是 0 。

10.

int add(int a, int b)
{
  return a + b;
}

int add(int a, int b)

{

return a + b;

}

Q：函式 add(INT_MAX, 1) 的結果是什麼？

A：有符號整數的溢位結果是未定義的行為。

11.

int neg(int a)
{
  return -a;
}

int neg(int a)

{

return -a;

}

Q：這裡是否可能出現未定義的行為？如果是的話，是在輸入什麼引數時發生的？

A：neg(INT_MIN)。如果 ECM 用補碼錶示負整數，那麼 INT_MIN 的絕對值比 INT_MAX 的絕對值大一。在這種情況下，-INT_MIN 造成了有符號整數的溢位，這是一種未定義的行為。

12.

int div(int a, int b)
{
  assert(b != 0);
  return a / b;
}

int div(int a, int b)

{

assert(b != 0);

return a / b;

}

Q：這裡是否可能出現未定義的行為？如果是的話，是在什麼引數上發生的？

A：如果 ECM 用補碼錶示負數，那麼 div(INT_MIN, -1) 導致了與上一個例子相同的問題。

看完這個你還不會插入排序麼
2018-11-24
排序
C語言的角落——這些C語言不常用的特性你知道嗎？
2020-11-24
C語言
好你個C語言，原來還有這麼多副面孔！
2021-01-23
C語言
看完動畫你還敢說不會快速排序
2018-11-23
動畫排序
Hive（總）看完這篇，別說你不會Hive！
2020-09-24
Hive
C語言新手最常見的問題！你在這裡跌倒過嗎？
2018-08-30
C語言
這些情況會阻礙你學習Rust語言 - dystroy
2021-12-16
Rust
還在問什麼是JavaScript建構函式、例項、原型物件以及原型鏈？看完這篇你就懂
2020-08-24
JavaScript函式原型物件
你說你懂計算機網路，那這些你都知道嗎
2019-12-12
計算機網路
為什麼說遊戲策劃要懂點美術？看完這篇你就明白了
2021-04-21
遊戲
主元素問題（C語言）
2024-08-31
C語言
看完這場分享會，你將更懂如何在快手上“買量”
2020-08-20
職場規劃局丨看完這篇文章，你會發現自己還有另一種活法！
2018-10-20
你覺得前端有必要懂後端語言嗎？
2024-12-03
前端後端
看完這篇原型設計模式，還不會，請你吃瓜
2023-02-20
原型設計模式
你後悔進入IT行業嗎？懂這些技術只會後悔沒早點搞IT！
2020-04-08
行業
C語言解決排序問題
2020-11-06
C語言排序
你說啥什麼?註解你還不會？
2020-09-06
這些 SpringBoot 面試題你會嗎？
2019-04-27
Spring Boot面試題
大廠Android面試，居然還問這些問題！
2019-03-29
Android面試
誰說資料分析很難？看完這7大分析套路後，還學不會的來找我
2021-04-28
當面試官說“你還有什麼問題想問的”,你該如何回答？
2019-04-04
面試
當面試官說 “你還有什麼問題想問的” ，你該如何回答？
2019-03-30
面試
當面試官說 “你還有什麼問題想問的”，你該如何回答？
2019-11-07
面試
C語言常見使用問題2
2020-10-24
C語言
C語言指標常見問題
2023-01-05
C語言指標
如果不會這兩招，千萬不要說你懂大資料
2020-10-13
大資料
【C語言練習題】小球反彈問題
2020-12-11
C語言
Go語言 | goroutine不只有基礎的用法，還有這些你不知道的操作
2020-09-07
Go
【面試官問】你懂函數語言程式設計嗎？
2019-04-27
面試函數程式設計
你信不信？初學C語言的人都犯過這些低階的錯誤！
2020-12-31
C語言
保證你一看就懂的C語言指標模型
2020-12-29
C語言指標模型
MyBatis面試題集合，90%會遇到這些問題
2019-08-28
MyBatis面試題
C語言小白記錄自己的錯題和總結
2024-10-18
C語言
Linux下C語言編譯的問題
2018-12-18
LinuxC語言編譯
c 語言指標操作經典問題
2020-12-19
指標
快速排序用C語言可以這麼寫
2020-12-07
排序C語言
關於C語言Switch語句，先學這些技巧夠不夠？
2020-10-22
C語言
看完這篇你不能再說不懂SSO原理了！
2023-02-17

看完這些問題後，你還會說自己懂 C 語言麼？

相關文章