在Visual C++中使用內聯彙編

看雪資料發表於2002-09-04

在Visual C++中使用內聯彙編

一、內聯彙編的優缺點

   因為在Visual C++中使用內聯彙編不需要額外的編譯器和聯接器,且可以處理Visual C++中不能處理的一些事情,而且可以使用在C/C++中的變數,所以非常方便。內聯彙編主要用於如下場合:

   1.使用匯編語言寫函式;
   2.對速度要求非常高的程式碼;
   3.裝置驅動程式中直接訪問硬體;
   4."Naked" Call的初始化和結束程式碼。
     //(."Naked",理解了意思,但是不知道怎麼翻譯^_^,大概就是不需要C/C++的編譯器(自作聰明)生成的函式初始化和收尾程式碼,請參看MSDN的"Naked Functions"的說明)

   內聯彙編程式碼不易於移植,如果你的程式打算在不同型別的機器(比如x86和Alpha)上執行,應當儘量避免使用內聯彙編。這時候你可以使用MASM,因為MASM支援更方便的的宏指令和資料指示符。


二、內聯彙編關鍵字

   在Visual C++使用內聯彙編用到的是__asm關鍵字,這個關鍵字有兩種使用方法:

   1.簡單__asm塊
       __asm
       {
           MOV     AL, 2
           MOV     DX, 0XD007
           OUT     AL, DX
       }

   2.在每條彙編指令之前加__asm關鍵字
       __asm MOV   AL, 2
       __asm MOV   DX, 0xD007
       __asm OUT   AL, DX

   因為__asm關鍵字是語句分隔符,因此你可以把彙編指令放在同一行:
       __asm MOV AL, 2     __asm MOV DX, 0XD007    __asm OUT AL, DX

   顯然,第一種方法和C/C++的風格很一致,並且有很多其它優點,因此推薦使用第一種方法。

   不象在C/C++中的"{}",__asm塊的"{}"不會影響C/C++變數的作用範圍。同時,__asm塊可以巢狀,巢狀也不會影響變數的作用範圍。



三、在__asm塊中使用匯編語言

   1.內聯彙編指令集
   內聯彙編完全支援的Intel 486指令集,允許使用MMX指令。不支援的指令可以使用_EMIT偽指令定義(_EMIT偽指令說明見下文)。

   2.MASM表示式
   內聯彙編可以使用MASM中的表示式。比如: MOV EAX, 1。

   3.資料指示符和運算子
   雖然__asm塊中允許使用C/C++的資料型別和物件,但它不能用MASM指示符和運算子定義資料物件。這裡特別指出,__asm塊中不允許MASM中的定義指示符: DB、DW、DD、DQ、DT和DF,也不允許DUP和THIS運算子。MASM結構和記錄也不再有效,內聯彙編不接受STRUC、RECORD、WIDTH或者MASK。

   4.EVEN和ALIGN指示符
   儘管內聯彙編不支援大多數MASM指示符,但它支援EVEN和ALIGN,當需要的時候,這些指示符在彙編程式碼裡面加入NOP(空操作)指令使標號對齊到特定邊界。這樣可以使某些處理器取指令時具有更高的效率。

   5.MASM宏指示符
   內聯彙編不是宏彙編,不能使用MASM宏指示符(MACRO、REPT、IRC、IRP和ENDM)和宏運算子(<>、!、&、%和.TYPE)。

   6.段說明
   必須使用暫存器來說明段,跨越段必須顯式地說明,如ES:[BX]。

   7.型別和變數大小
   我們可以使用LENGTH來取得C/C++中的陣列中的元素個數,如果不是一個陣列,則結果為一。使用SIZE來取得C/C++中變數的大小,一個變數的大小是LENGTH和TYPE的乘積。TYPE用來取得一個變數的大小,如果是一個陣列,它得到的一個陣列中的單個元素的大小。

   8.註釋
   可以使用C/C++的註釋,但推薦用ASM的註釋,即";"號。

   9._EMIT偽指令
   _EMIT偽指令相當於MASM中的DB,但一次只能定義一個位元組,比如:
       __asm
       {
           JMP     _CodeOfAsm

           _EMIT   0x00    ; 定義混合在程式碼段的資料
           _EMIT   0x01

       _CodeOfAsm:
           ; 這裡是程式碼
           _EMIT   0x90    ; NOP指令
       }



四、在__asm塊中使用C/C++語言元素

   C/C++與彙編可以混合使用,在內聯彙編可以使用C/C++的變數和很多其它C/C++的元素。在__asm塊中可以使用以下C/C++元素:

   1.符號,包括標號、變數和函式名;

   2.常量,包括符號常量和列舉型(enum)成員;

   3.宏定義和預處理指示符;

   4.註釋,包括"/**/"和"//";

   5.型別名,包括所有MASM中合法的型別

   6.typedef名稱, 像PTR、TYPE、特定的結構成員或列舉成員這樣的通用運算子。

   在__asm塊中,可以使用C/C++或ASM的基數計數法(比如: 0x100和100H是相等的)。

   __asm塊中不能使用像<<一類的C/C++運算子。C/C++和MASM通用的運算子,比如"*"和"[]"運算子,都被認為是組合語言的運算子。舉個例子:

       int array[10];

       __asm MOV array[6], BX ;  Store BX at array+6 (not scaled)

       array[6] = 0;         /* Store 0 at array+12 (scaled) */

   * 小技巧: 內聯彙編中,你可以使用TYPE運算子使作其與C一致。比如,下面兩條語句是一樣的:

       __asm MOV array[6 * TYPE int], 0 ; Store 0 at array + 12

       array[6] = 0;                   /* Store 0 at array + 12 */

   內聯彙編能透過變兩名直接引用C/C++的變數。__asm塊中可以引用任何符號,包括變數名。

   如果C/C++中的類、結構或者列舉成員具有唯一的名稱,如果在"."運算子之前不指定變數或者typedef名稱,則__asm塊中只能引用成員名稱。然而,如果成員不是唯一的,你必須在"."運算子之前加上變數名或typedef名稱。例如,下面的兩個結構都具有same_name這個成員變數:

       struct first_type
       {
           char *weasel;
           int same_name;
       };

       struct second_type
       {
           int wonton;
           long same_name;
       };

   如果按下面宣告變數:

       struct first_type hal;
       struct second_type oat;

   那麼,所有引用same_name成員的地方都必須使用變數名,因為same_name不是唯一的。另外,上面的weasel變數具有唯一的名稱,你可以僅僅使用它的成員名稱來引用它:

       __asm
       {
           MOV EBX, OFFSET hal
           MOV ECX, [EBX]hal.same_name ; 必須使用 'hal'
           MOV ESI, [EBX].weasel       ; 可以省略 'hal'
       }

   注意,省略了變數名僅僅是為了寫程式碼的方便,生成的彙編指令的還是一樣的。

   可以不受限制地訪問C++成員變數,但是不能呼叫C++的成員函式。



五、暫存器使用

   一般來說,在__asm塊開始的時候,暫存器是空的,不能在兩個__asm之間儲存暫存器的值。(這是MSDN上說的,我在實際使用時發現,好像並不是這樣。不過它是說"一般",我是特殊:))

   如果一個函式被宣告成了__fastcall,則其引數將放在暫存器中,這將給暫存器的管理帶來問題。所以,如果要將一個函式宣告成__fastcall,必須儲存ECX暫存器。為了避免以上的衝突,在宣告為__fastcall的函式中不要有__asm塊。如果用了/Gr編譯選項(它全域性的變成__fastcall),將每個函式宣告成__cdecl或者__stdcall,這個屬性告訴編譯器用傳統的C方法。

   如果使用EAX、EBX、ECX、EDX、ESI和EDI暫存器,你不需要儲存它;但如果你用到了DS、 SS、SP、BP和標誌暫存器,那就應該PUSH儲存這些暫存器。

   如果程式中改變了用於STD和CLD的方向標誌,你必須將其恢復到原來的值。




六、轉跳

   可以在C裡面使用goto調到__asm塊中的標號處,也可以在__asm塊中轉跳到__asm塊裡面和外面的標號處。__asm塊內的標號是不區分大小寫的(指令、指示符等也是不區分大小寫的)。例:

       void func()
       {
               goto C_Dest;    /* 合法 */
               goto c_dest;    /* 錯誤 */

               goto A_Dest;    /* 合法 */
               goto a_dest;    /* 合法 */

               __asm
               {
                       JMP C_Dest  ; 合法
                       JMP c_dest  ; MSDN上說合法,但是我在VS.NET中編譯,認為這樣不合法

                       JMP A_Dest  ; 合法
                       JMP a_dest  ; 合法

       a_dest:     ; __asm 標號
               }

       C_Dest:     /* C的標號 */
       return;
       }


   不要使用函式名稱當作標號,否則將使其跳到函式執行而不是標號處。如下所示:

       ; 錯誤: 使用函式名作為標號
       JNE exit
       .
       .
       .
       exit:
       ; 下面是更多的ASM程式碼


   美元符號$用於指定當前位置,如下所用,常用於條件跳轉:

       JNE $+5 ; 下面這條指令的長度是5個位元組
       JMP farlabel
       ;$+5,跳到了這裡
       .
       .
       .
       farlabel:



七、呼叫函式

   內聯彙編呼叫C/C++函式必須自己清除堆疊,下面是一個呼叫C/C++函式例子:

       #include <stdio.h>

       char szformat[] = "%s %s\n";
       char szHello[] = "Hello";
       char szWorld[] = " world";
       void main()
       {
           __asm
           {
               MOV     EAX, OFFSET szWorld
               PUSH    EAX
               MOV     EAX, OFFSET szHello
               PUSH    EAX
               MOV     EAX, OFFSET szformat
               PUSH    EAX
               CALL    printf

               //內聯彙編呼叫C函式必須自己清除堆疊
               //用不使用的EBX暫存器清除堆疊,或ADD ESP, 12
               POP     EBX
               POP     EBX
               POP     EBX
           }
       }

   注意:函式引數是從右向左壓棧。

   不能夠訪問C++中的類成員函式,但是可以訪問extern "C"函式。

   如果呼叫Windows API函式,則不需要自己清除堆疊,因為API的返回指令是RET n,會自動清除堆疊

   比如下面的例子:

       #include <windows.h>

       char szAppName[] = "API Test";

       void main()
       {
           char szHello[] = "Hello, world!";

           __asm
           {
               PUSH    MB_OK OR MB_ICONINformATION
               PUSH    OFFSET szAppName    ; 全域性變數用OFFSET
               LEA     EAX, szHello        ; 區域性變數用LEA
               PUSH    EAX
               PUSH    0
               CALL    DWORD PTR [MessageBoxA]     ; 注意這裡,我費了好大周折才發現不是CALL MessageBoxA
           }
       }

   一般來說,在Visual C++中使用內聯彙編是為了提高速度,因此這些函式呼叫盡可能用C/C++寫。



八、一個例子

   下面的例子是在VS.NET(即VC7)中C語言寫的。先建一個工程,將下列程式碼放到工程中的.c檔案中編譯,無需作特別的設定,即可編譯透過。

   ////////////////////////////////////////////////////////////////////////////////////////////////////
   //預處理
   #include <Windows.h>
   ////////////////////////////////////////////////////////////////////////////////////////////////////


   ////////////////////////////////////////////////////////////////////////////////////////////////////
   //全域性變數
   HWND g_hWnd;
   HINSTANCE g_hInst;

   TCHAR szTemp[1024];

   TCHAR szAppName[] = "CRC32 Sample";
   ////////////////////////////////////////////////////////////////////////////////////////////////////


   ////////////////////////////////////////////////////////////////////////////////////////////////////
   //函式宣告
   DWORD GetCRC32(const BYTE *pbData, int nSize);
   int WINAPI WinMain(HINSTANCE hInstance, HINSTANCE hPrevInstance, LPSTR lpCmdLine, int iCmdShow);
   LRESULT CALLBACK WindowProc(HWND hWnd, UINT uMsg, WPARAM wParam, LPARAM lParam);
   ////////////////////////////////////////////////////////////////////////////////////////////////////




   ////////////////////////////////////////////////////////////////////////////////////////////////////
   //主函式
   int WINAPI WinMain(HINSTANCE hInstance, HINSTANCE hPrevInstance, LPSTR lpCmdLine, int iCmdShow)
   {
       MSG msg;
       WNDCLASSEX wndClassEx;

       g_hInst = hInstance;

       wndClassEx.cbSize = sizeof(WNDCLASSEX);
       wndClassEx.style = CS_VREDRAW | CS_HREDRAW;
       wndClassEx.lpfnWndProc = (WNDPROC) WindowProc;
       wndClassEx.cbClsExtra = 0;
       wndClassEx.cbWndExtra = 0;
       wndClassEx.hInstance = g_hInst;
       wndClassEx.hIcon = LoadIcon(NULL, IDI_APPLICATION);
       wndClassEx.hCursor = LoadCursor(NULL, IDC_ARROW);
       wndClassEx.hbrBackground = (HBRUSH) (COLOR_WINDOW);
       wndClassEx.lpszMenuName = NULL;
       wndClassEx.lpszClassName = szAppName;
       wndClassEx.hIconSm = NULL;

       RegisterClassEx(&wndClassEx);

       g_hWnd = CreateWindowEx(0, szAppName, szAppName, WS_OVERLAPPED | WS_CAPTION | WS_SYSMENU | WS_THICKFRAME | WS_MINIMIZEBOX,
           CW_USEDEFAULT, CW_USEDEFAULT, 300, 70,
           NULL, NULL, g_hInst, NULL);

       ShowWindow(g_hWnd, iCmdShow);
       UpdateWindow(g_hWnd);

       while (GetMessage(&msg, NULL, 0, 0))
       {
           TranslateMessage(&msg);
           DispatchMessage(&msg);
       }
       return ((int) msg.wParam);
   }
   ////////////////////////////////////////////////////////////////////////////////////////////////////



   ////////////////////////////////////////////////////////////////////////////////////////////////////
   //主視窗回撥函式
   LRESULT CALLBACK WindowProc(HWND hWnd, UINT uMsg, WPARAM wParam, LPARAM lParam)
   {
       switch (uMsg)
       {
       case WM_CREATE:
           CreateWindowEx(WS_EX_CLIENTEDGE, "EDIT", NULL, WS_CHILD | WS_VISIBLE | WS_BORDER | ES_AUTOHSCROLL | ES_AUTOVSCROLL | ES_NOHIDESEL | WS_OVERLAPPED,
               7, 12, 220, 22,
               hWnd, (HMENU)1000, g_hInst, NULL);
           CreateWindowEx(0, "BUTTON", "&OK", WS_CHILD | WS_VISIBLE | BS_PUSHBUTTON | WS_OVERLAPPED | BS_FLAT,
               244, 12, 40, 20,
               hWnd, (HMENU)IDOK, g_hInst, NULL);

           break;

       case WM_COMMAND:
           switch (LOWORD(wParam))
           {
           case IDOK:
               GetDlgItemText(g_hWnd, 1000, szTemp + 100, 800);
               wsprintf(szTemp, "當前文字框內的字串的CRC32校驗碼是: 0x%lX", GetCRC32(szTemp + 100, (int)strlen(szTemp + 100)));
               MessageBox(g_hWnd, szTemp, szAppName, MB_OK|MB_ICONINformATION);
           }
           break;

       case WM_DESTROY:
           PostQuitMessage(0);
           break;

       default:
           return (DefWindowProc(hWnd, uMsg, wParam, lParam));
       }
       return (0);
   }
   ////////////////////////////////////////////////////////////////////////////////////////////////////




   ////////////////////////////////////////////////////////////////////////////////////////////////////
   //GetCRC32: 求位元組流的CRC32校驗碼
   //引數:
   //      pbData: 指向位元組流緩衝區首地址
   //      nSize: 位元組流長度
   //
   //返回值:
   //      位元組流的CRC32校驗碼
   //
   //這裡使用查表法求CRC32校驗碼,這部分是參考老羅的文章《 矛與盾的較量(2)――CRC原理篇》該寫的。
   //原文的具體內容請參看: http://asp.7i24.com/netcool/laoluo/articles/show_article.asp?Article_ID=15
   //
   //下面使用內聯彙編求CRC32校驗碼,充分使用了CPU中的暫存器,速度和方便性都是使用C/C++所不能比擬的
   //

   DWORD GetCRC32(const BYTE *pbData, int nSize)
   {
       DWORD dwCRC32Table[256];

       __asm   //這片內聯彙編是初始化CRC32表
       {
           MOV     ECX, 256

   _NextTable:
           LEA     EAX, [ECX-1]
           PUSH    ECX
           MOV     ECX, 8

   _NextBit:
           SHR     EAX, 1
           JNC     _NotCarry
           XOR     EAX, 0xEDB88320
   _NotCarry:
           DEC     ECX
           JNZ     _NextBit

           POP     ECX
           MOV     [dwCRC32Table + ECX*4 - 4], EAX
           DEC     ECX
           JNZ     _NextTable
       }

       __asm   //下面是求CRC32校驗碼
       {
           MOV     EAX, -1
           MOV     EBX, pbData
           OR      EBX, EBX
           JZ      _Done
           MOV     ECX, nSize
           OR      ECX, ECX
           JZ      _Done

   _NextByte:
           MOV     DL, [EBX]

           XOR     DL, AL
           MOVZX   EDX, DL
           SHR     EAX, 8
           XOR     EAX, [dwCRC32Table + EDX*4]

           INC     EBX
           LOOP    _NextByte
   _Done:
           NOT     EAX
       }
   }

   ////////////////////////////////////////////////////////////////////////////////////////////////////



九、後話

   本來打算寫個綜合各種內聯彙編用法的例子,由於本人拖拖拉拉的習慣,雖經dREAMtHEATER多次催促,到最後還是不免草草了事。如果有什麼謬誤或不明之處,歡迎批評指正並一起探討(QQ: 123018)。



                                                Yonsm@163.com
                                                     2002.9.3

==============================================================
>> 參考資料:
 1.Sunwen,《VC內聯ASM彙編學習筆記》
 2.老羅,《矛與盾的較量(2)――CRC原理篇》
 3.Microsoft,《MSDN Library - January 2001》

~・  全文完 ・~

相關文章