面試挖坑題:之C語言底層操作問題

千鋒Python唐小強發表於2020-08-13

C語言的記憶體模型基本上對應了現在von Neumann(馮·諾伊曼)計算機的實際儲存模型,很好的達到了對機器的對映,這是C/C++適合做底層開發的主要原因,另外,C語言適合做底層開發還有另外一個原因,那就是C語言對底層操作做了很多的的支援,提供了很多比較底層的功能。

面試挖坑題:之C語言底層操作問題

  下面結合問題分別進行闡述。

  1、問題:移 操作

  在運用移位運算子時,有兩個問題必須要清楚:

  (1)、在右移操作中,騰空位是填 0 還是符號位;

  (2)、什麼數可以作移位的位數。

  答案 分析:

  ">>"和"<<"是指將變數中的每一位向右或向左移動, 其通常形式為:
  右移: 變數名>>移位的位數
  左移: 變數名<<移位的位數
  經過移位後, 一端的位被"擠掉",耳另一端空出的位以0 填補,在C語言中的移位不是迴圈移動的。
  (1) 第一個問題的答案很簡單,但要根據不同的情況而定。如果被移位的是無符號數,則填 0 。如果是有符號數,那麼可能填 0 或符號位。如果你想解決右移操作中騰空位的填充問題,就把變數宣告為無符號型,這樣騰空位會被置 0。
  (2) 第二個問題的答案也很簡單:如果移動 n 位,那麼移位的位數要不小於 0 ,並且一定要小於 n 。這樣就不會在一次操作中把所有資料都移走。
  比如,如果整型資料佔 32 位,n 是一整型資料,則 n << 31 和 n << 0 都合法,而 n << 32 和 n << -1 都不合法。
  注意即使騰空位填符號位,有符號整數的右移也不相當與除以 。為了證明這一點,我們可以想一下 -1 >> 1 不可能為 0 。

 2、問題:位段結構


struct 
RPR_ATD_TLV_HEADER

{
ULONG res1 :6;
ULONG type :10;
ULONG res1 :6;
ULONG length :10;
};

  位段結構是一種特殊的結構, 在需按位訪問一個位元組或字的多個位時, 位結構比按位運算子更加方便。

  位結構定義的一般形式為:

struct位結構名{

 資料型別 變數名: 整型常數;

 資料型別 變數名: 整型常數;

} 位結構變數;

  其中: 整型常數必須是非負的整數, 範圍是0~15, 表示二進位制位的個數, 即表示有多少位

  變數名是選擇項, 可以不命名, 這樣規定是為了排列需要。

  例如: 下面定義了一個位結構。



struct{ 

  unsigned incon: 8; /*incon佔用低位元組的0~7共8位*/
  unsigned txcolor: 4; /*txcolor佔用高位元組的0~3位共4位*/
  unsigned bgcolor: 3; /*bgcolor佔用高位元組的4~6位共3位*/
  unsigned blink: 1; /*blink佔用高位元組的第7位*/
}ch;

  位結構成員的訪問與結構成員的訪問相同。

  例如: 訪問上例位結構中的bgcolor成員可寫成:

ch.bgcolor

  位結構成員可以與其它結構成員一起使用。 按位訪問與設定,方便&節省

  例如:



struct 
info{ 

  char name[ 8];
  int age;
  struct addr address;
  float pay;
  unsigned state: 1;
  unsigned pay: 1;
}workers;

  上例的結構定義了關於一個工從的資訊。其中有兩個位結構成員, 每個位結構成員只有一位, 因此只佔一個位元組但儲存了兩個資訊, 該位元組中第一位表示工人的狀態, 第二位表示工資是否已發放。由此可見使用位結構可以節省存貯空間。

  注意不要超過值限制

  3、問題:位元組對齊

  我在使用VC程式設計的過程中,有一次呼叫DLL中定義的結構時,發覺結構都亂掉了,完全不能讀取正確的值,後來發現這是因為DLL和呼叫程式使用的位元組對齊選項不同,那麼我想問一下,位元組對齊究竟是怎麼一回事?

答案與分析:

  關於位元組對齊:

  1、 當不同的結構使用不同的位元組對齊定義時,可能導致它們之間互動變得很困難。

  2、 在跨CPU進行通訊時,可以使用位元組對齊來保證唯一性,諸如通訊協議、寫驅動程式時候暫存器的結構等。

  三種對齊方式:

  1、 自然對齊方式(Natural Alignment):與該資料型別的大小相等。

  2、 指定對齊方式 :


#
pragma pack(8) 
//指定Align為 8;

#pragma pack() //恢復到原先值

  3、 實際對齊方式:

Actual Align = min ( Order Align, Natual Align )

  對於複雜資料型別(比如結構等):實際對齊方式是其成員最大的實際對齊方式:

Actual Align = max( Actual align1,2,3,…

  編譯器的填充規律:

  1、 成員為成員Actual Align的整數倍,在前面加Padding。
  成員Actual Align = min( 結構Actual Align,設定對齊方式)
  2、 結構為結構Actual Align的整數倍,在後面加Padding.

  例子分析:


#
pragma pack(8) 
//指定Align為 8

struct STest1
{
char ch1;
long lo1;
char ch2;
} test1;
#pragma pack()

  現在

Align of STest1 = 4 , sizeof STest1 = 12 ( 4 * 3 )

  test1在記憶體中的排列如下( FF 為 padding ):


00 
-- 
-- 
-- 
04 
-- 
-- 
-- 
08 
-- 
-- 
-- 
12 
-- 
-- 
--

01 FF FF FF 01 01 01 01 01 FF FF FF
ch1 -- lo1 -- ch2
#pragma pack(2) //指定Align為 2
struct STest2
{
char ch3;
STest1 test;
} test2;
#pragma pack()

  現在 Align of STest1 = 2, Align of STest2 = 2 , sizeof STest2 = 14 ( 7 * 2 )

  test2在記憶體中的排列如下:


00 
-- 
-- 
-- 
04 
-- 
-- 
-- 
08 
-- 
-- 
-- 
12 
-- 
-- 
--

02 FF 01 FF FF FF 01 01 01 01 01 FF FF FF
ch3 ch1 -- lo1 -- ch2

  注意事項:

  1、 這樣一來,編譯器無法為特定平臺做最佳化,如果效率非常重要,就儘量不要使用#pragma pack,如果必須使用,也最好僅在需要的地方進行設定。
  2、 需要加pack的地方一定要在定義結構的標頭檔案中加,不要依賴命令列選項,因為如果很多人使用該標頭檔案,並不是每個人都知道應該pack。這特別表現在為別人開發庫檔案時,如果一個庫函式使用了struct作為其引數,當呼叫者與庫檔案開發者使用不同的pack時,就會造成錯誤,而且該類錯誤很不好查。
  3、 在VC及BC提供的標頭檔案中,除了能正好對齊在四位元組上的結構外,都加了pack,否則我們編的Windows程式哪一個也不會正常執行。
  4、 在 #pragma pack(n) 後一定不要include其他標頭檔案,若包含的標頭檔案中改變了align值,將產生非預期結果。
  5、 不要多人同時定義一個資料結構。這樣可以保證一致的pack值。

4、問題:按位運算子

  C語言和其它高階語言不同的是它完全支援按位運算子。這與組合語言的位操作有些相似。 C中按位運算子列出如下:

━━━━━━━━━━━━━━━━━━━━━━━━━━━━

運算子 作用

────────────────────────────

& 位邏輯與

| 位邏輯或

^ 位邏輯異或

- 位邏輯反

>> 右移

<< 左移

━━━━━━━━━━━━━━━━━━━━━━━━━━━━

  注意:

  1、 按位運算是對位元組或字中的實際位進行檢測、設定或移位, 它只適用於字元型和整數型變數以及它們的變體, 對其它資料型別不適用。
  2、 關係運算和邏輯運算表示式的結果只能是1或0。 而按位運算的結果可以取0或1以外的值。 要注意區別按位運算子和邏輯運算子的不同, 例如, 若x=7, 則x&&8 的值為真(兩個非零值相與仍為非零), 而x&8的值為0。
  3、 | 與 ||,&與&&,~與! 的關係

  &、| 和 ~ 運算子把它們的運算元當作一個為序列,按位單獨進行操作。比如:10 & 12 = 8,這是因為"&"運算子把 10 和 12 當作二進位制描述 1010 和 1100 ,所以只有當兩個運算元的相同位同時為 1 時,產生的結果中相應位才為 1 。同理,10 | 12 = 14 ( 1110 ),透過補碼運算,~10 = -11 ( 11...110101 )。<以多少為一個位序列> &&、|| 和!運算子把它們的運算元當作"真"或"假",並且用 0 代表"假",任何非 0 值被認為是"真"。它們返回 1 代表"真",0 代表"假",對於"&&"和"||"運算子,如果左側的運算元的值就可以決定表示式的值,它們根本就不去計算右側的運算元。所以,!10 是 0 ,因為 10 非 0 ;10 && 12 是 1 ,因為 10 和 12 均非 0 ;10 || 12也是 1 ,因為 10 非 0 。並且,在最後一個表示式中,12 根本就沒被計算,在表示式 10 || f( ) 中也是如此。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69923331/viewspace-2711445/,如需轉載,請註明出處,否則將追究法律責任。

相關文章