再談c++型別轉換

鴨脖發表於2012-04-23

今天在研究字元編碼的時候偶然想到一個問題,在ansi編碼中,一箇中文字元是用兩個位元組表示的,但是一個char是一個位元組,那麼如果我將一箇中文字元賦值給一個char變數的話,列印輸出會發生什麼情況呢?

試了一下,發現亂碼,意料之中,顯然計算機還是把這個中文字元拆成了兩半,把其中的一般賦值給了變數a,那麼賦給它的到底是哪一半呢?

試一下便知道了,中文字元‘你’的十六進位制編碼是C4 E3,那麼按照下面程式輸出結果為:

char a = '你';
cout<<(int)a;


輸出結果為-29,計算E3的結果和該結果相同,那麼我們推測選取的是後一半。再用‘我’進行驗證。C4 D2,結果為-46,猜想正確。

其實在上面的程式中發生了兩次轉換,第一次是把你這個字元拆成兩半,把後一半賦值給a,第二次由於a是一個位元組而int是四個位元組,那麼需要在a前面補零以達到四個位元組的長度。


那麼如果將int賦值給char變數,擷取的是不是也是後一段呢?由下面的程式可以看出:

int b = 7898;
char c = b;
cout<<(int)c;


程式結果為-38,而7898的二進位制編碼為1111011011010,研究其後八位,發現其結果一致,所以計算機截圖的還是後面八位,而不是前面的八位。

所以我們現在便可以想到,計算機在擷取的時候總是在後面擷取而不是在前面擷取。


但是在計算機中浮點數的表示卻有點複雜,那麼計算機在由浮點數轉換為其他型別時也是不一樣的。例如由浮點數轉換為int整數,那麼計算機擷取的是整數部分,而不是後32位。那麼浮點數轉換為char型的呢?

double aa = 3000.9;
char te = aa;
cout<<endl<<(int)te;

結果為-72,剛好為3000的二進位制表示結果,經過多次驗證,發現其實浮點數轉換為char型是先轉換為int型,再由int型轉換為char型的。


更多型別轉換,請繼續關注本部落格。

相關文章