對C語言中無符號型別的建議

rexnie發表於2018-05-06

原文網址 : https://juejin.im/post/5aeef2eb6fb9a07ab508cc85

算術型別轉換

首先給出一段C程式碼:

int main(void)
{
	if (-1 < (unsigned char)1)
		printf("true, ANSI C semantics\n");
	else
		printf("false, K&R C semantics\n");
	return 0;
}
複製程式碼

這段程式分別在ANSI C和K&R C編譯器下編譯的話，執行的結果是不同的。-1的位模式是一樣的，但ANSI C編譯器將它解釋為有符號數，是個負數。K&R C編譯器卻將它解釋為無符號數，變成了一個非常大都正數。這是因為兩個標準在做算術型別轉換時使用的規則不同導致的。

在《The C Programming Language》A.6算術型別轉換章節詳細描述了ANSI C的轉換規則。許多運算子都會以類似的方式在運算過程中引起轉換，併產生結果型別。其效果是將所有運算元轉換為同一公共型別，並以此作為結果的型別。這種方式的轉換稱為普通算術型別轉換。

首先，如果任何一個運算元為long double型別，則將另一個運算元轉換為long double型別。

否則，如果任何一個運算元為double型別，則將另一個運算元轉換為double型別。

否則，如果任何一個運算元為float型別，則將另一個運算元轉換為float型別。

否則，同時對兩個運算元進行整形提升(integral promotion)。所謂整形提升，就是在一個表示式中，char,short,int型位域(bit-field),包括它們的有符號型別或者無符號型別，以及列舉型別等這些型別都需要提升為int或者unsigned int型別。如果原始型別的所有值都可用int型別表示，則其值將被轉換為int類；否則將被轉換為unsigned int型別。

整形提升之後，如果任何一個運算元為unsigned long int型別，則將另一個運算元轉換為unsigned long int型別。

否則，如果任何一個運算元為long int型別且另一個運算元為unsigned int型別，則結果依賴於long int型別是否可以表示所有的unsigned int型別的值。如果可以，則將unsigned int型別的運算元轉換為long int型別。如果不可以，則將兩個運算元都轉換為unsigned long int型別。

否則，如果任何一個運算元為long int型別，則將另一個運算元轉換為long int型別。

否則，如果任何一個運算元為unsigned int型別，則將另一個運算元轉換為unsigned int型別。

否則，將兩個運算元都轉換為int型別。

所以ANSI C採用的是值保留(value preversing)原則，儘量保證不會發生溢位。而K&R C的規則比較簡單，採用的是無符號保留(unsigned preversing)原則。就是當一個無符號型別與int或更小的整形混合使用時，結果型別是無符號型別，這個規則簡單，與硬體無關，但是有時會使一個負數丟失符號位。

結合上例，在ANSI C編譯器下，unsigned char的1被提升為int型別，所以if條件為真。但是在K&R C編譯器下，由於<操作符右邊是unsigned char型別，所以<操作符左邊會轉化為unsigned int,結果是unsigned int,所以if條件為假。

這裡提到K&R C標準，是為了說明在說明ANSI C型別轉換時，有個對比。在實際專案中，應該都遵從ANSI C的規範，這樣程式碼可最大限度地保證程式的可移植性。

給出另一段C程式碼:

int array[] = { 23, 34, 12,
	17, 204, 99, 16
};

#define TOTAL_ELEMENTS (sizeof(array) / sizeof(array[0]))

int main(void)
{
	int d = -1, x = 0;

	if (d <= TOTAL_ELEMENTS - 2)
		x = array[d+1];

	printf("x=%d\n", x);
	return 0;
}
複製程式碼

根據標準C的規則，因為sizeof是unsigned型別，所以<=操作符左邊會轉化為unsigned，因此x=0.需要修正該問題，可以做如下改動：

if (d <= (int)TOTAL_ELEMENTS - 2)
		x = array[d+1];
複製程式碼

關於無符號型別的建議

關於無符號型別的建議：

儘量不要在你的程式碼中使用無符號型別，以免增加不必要的複雜性。尤其是，不要僅僅因為無符號數不存在負值(如年齡，國債)而用它來表示數量。

儘量使用int那樣的有符號型別，這樣在涉及型別轉換時，不必邊界問題。

只有在使用bit-field和二進位制掩碼時，才使用無符號數。應該在表示式中使用強制型別轉換，使運算元均為有符號數或者無符號數，這樣不必由編譯器來選擇結果的型別。

關於ANSI C的整形提升的補充

C語言中的型別轉換比一般人想象中的要廣泛的多。看個例子：

printf("%d %d", sizeof('A'), sizeof(char));
複製程式碼

這行程式碼列印出儲存一個字元型別的長度。結果都是1嗎?

實際的結果是4(32bit機器上)和1。字元常量'A'是char型別，由於sizeof('A')作為printf的引數，函式的引數也算是表示式，所以發生了轉型提升。

再看個例項：

char c1, c2;
...
c1 = c1 + c2;
複製程式碼

這裡c1和c2都需要先進行整形提升，即轉化為int,然後兩個int值相加，最後對和的結果進行裁剪。

參考：

《The C Programming Language中文版(第2版.新版)》
《C專家程式設計》

C語言中的資料型別
2024-08-23
C語言資料型別
C語言中識別符號的作用域、名稱空間、連結屬性、生命週期、儲存型別
2020-04-04
C語言符號型別
c語言中陣列的三種型別
2021-09-11
C語言陣列型別
C語言-識別符號命名
2018-11-22
C語言符號
dart系列之:dart語言中的內建型別
2021-11-09
Dart型別
c語言中const修飾符
2024-11-13
C語言
1413: C語言合法識別符號
2020-12-04
C語言符號
c語言中預設引數的兩種型別
2021-09-11
C語言型別
C語言合法識別符號 hd 2024
2020-04-06
C語言符號
[C]有符號數和無符號數
2019-01-12
符號
C語言中幾種報錯型別的解決方案
2020-11-30
C語言型別
Python 語言中的 “鴨子型別”
2018-11-05
Python型別
c++語言中類的私有型別或保護型別成員變數
2020-10-11
C++型別變數
Go語言的識別符號、關鍵字、字面量、型別
2019-02-16
Go符號型別
go 語言中預設的型別識別
2018-06-04
Go型別
二進位制安全_C語言中資料型別
2019-06-05
C語言資料型別
C語言中的複雜資料型別，你掌握了哪些？
2020-12-26
C語言資料型別
c語言中的資料型別的自動轉換原則
2020-04-28
C語言資料型別
R 語言中雙中括號 [[]]與資料型別列表的關係
2024-03-25
資料型別
Java資料型別、識別符號
2023-03-29
Java資料型別符號
C語言中，四則運算導致資料型別的轉換
2024-03-22
C語言資料型別
C語言中Pointer, Array，String and Structures的區別
2018-06-10
C語言Struct
java基本無法-識別符號
2020-12-12
Java符號
程式語言中為什麼使用分號作為語句結束符？
2024-05-08
C語言中的#和##
2024-09-01
C語言
C++ 提示未宣告的識別符號
2019-03-01
C++符號
c語言中%f輸出double型和float型值
2024-08-19
C語言
C語言中pi=&j和*pi=j的區別
2019-05-12
C語言
c語言中作用域和儲存期的區別
2024-12-07
C語言
C語言中水平製表符與退格鍵的使用方法探索
2024-08-14
C語言
[C語言] 將32位 int有符號型別的十進位制資料反轉輸出 [無需任何庫函式]
2024-08-12
C語言符號型別函式
關鍵字、資料型別、識別符號
2024-07-06
資料型別符號
Java註釋，識別符號，資料型別，型別轉換
2020-10-08
Java符號資料型別
python語言中基本資料型別有哪些?
2022-05-20
Python資料型別
解析C語言中的sizeof
2020-04-06
C語言
C語言中extern的用法
2019-01-01
C語言
c語言中的作用域
2024-11-10
C語言
C語言中結構體struct的對齊問題
2019-03-25
C語言結構體Struct

對C語言中無符號型別的建議

算術型別轉換

關於無符號型別的建議

關於ANSI C的整形提升的補充

相關文章