gcc 從語言編譯全過程 預處理---->編譯---->彙編----->連結

tianlangxiaoyue發表於2012-02-08
在Linux下進行C語言程式設計,必然要採用GNU GCC來編譯C原始碼生成可執行程式。 

一、GCC快速入門 

Gcc指令的一般格式為:Gcc [選項] 要編譯的檔案 [選項] [目標檔案] 

其中,目標檔案可預設,Gcc預設生成可執行的檔名為:編譯檔案.out 

我們來看一下經典入門程式"Hello World!" 

# vi hello.c 

#include <stdlib.h> 
#include <stdio.h> 
void main(void) 

printf("hello world!\r\n"); 


用gcc編譯成執行程式。 

#gcc hello.c 

該命令將hello.c直接生成最終二進位制可執行程式a.out 

這條命令隱含執行了(1)預處理、(2)彙編、(3)編譯並(4)連結形成最終的二進位制可執行程式。這裡未指定輸出檔案,預設輸出為a.out。 

如何要指定最終二進位制可執行程式名,那麼用-o選項來指定名稱。比如需要生成執行程式hello.exe 

那麼 

#gcc hello.c -o hello.exe 

二、GCC的命令剖析--四步走 

從上面我們知道GCC編譯原始碼生成最終可執行的二進位制程式,GCC後臺隱含執行了四個階段步驟。 

GCC編譯C原始碼有四個步驟: 

預處理-----> 編譯 ----> 彙編 ----> 連結 

現在我們就用GCC的命令選項來逐個剖析GCC過程。 

1)預處理(Pre-processing) 

在該階段,編譯器將C原始碼中的包含的標頭檔案如stdio.h編譯進來,使用者可以使用gcc的選項”-E”進行檢視。 

用法:#gcc -E hello.c -o hello.i 

作用:將hello.c預處理輸出hello.i檔案。 

[root]# gcc -E hello.c -o hello.i 
[root]# ls 
hello.c  hello.i 
[root]# vi hello.i 
# 1 "hello.c" 
# 1 "<built-in>" 
# 1 "<command line>" 
# 1 "hello.c" 
# 1 "/usr/include/stdlib.h" 1 3 
# 25 "/usr/include/stdlib.h" 3 
# 1 "/usr/include/features.h" 1 3 
# 291 "/usr/include/features.h" 3 
# 1 "/usr/include/sys/cdefs.h" 1 3 
# 292 "/usr/include/features.h" 2 3 
# 314 "/usr/include/features.h" 3 
# 1 "/usr/include/gnu/stubs.h" 1 3 
# 315 "/usr/include/features.h" 2 3 
# 26 "/usr/include/stdlib.h" 2 3 
# 3 "hello.c" 2 
void main(void) 

printf("hello world!\r\n"); 



2)編譯階段(Compiling) 

第二步進行的是編譯階段,在這個階段中,Gcc首先要檢查程式碼的規範性、是否有語法錯誤等,以確定程式碼的實際要做的工作,在檢查無誤後,Gcc把程式碼翻譯成組合語言。使用者可以使用”-S”選項來進行檢視,該選項只進行編譯而不進行彙編,生成彙編程式碼。 

選項 -S 

用法:[root]# gcc –S hello.i –o hello.s 

作用:將預處理輸出檔案hello.i彙編成hello.s檔案。 

[root@richard hello-gcc]# ls 

hello.c  hello.i  hello.s 

如下為hello.s彙編程式碼 

[root@richard hello-gcc]# vi hello.s 
.file   "hello.c" 
.section    .rodata 
.LC0: 
.string "hello world!\r\n" 
.text 
.globl main 
.type   main,@function 
main: 
pushl   %ebp 
movl    %esp, %ebp 
subl    $8, %esp 
andl    $-16, %esp 
movl    $0, %eax 
subl    %eax, %esp 
subl    $12, %esp 
pushl   $.LC0 
call    printf 
addl    $16, %esp 
movl    $0, %eax 
leave 
ret 
.Lfe1: 
.size   main,.Lfe1-main 
.ident  "GCC: (GNU) 3.2.2 20030222 (Red Hat Linux 3.2.2-5)" 

3)彙編階段(Assembling) 

彙編階段是把編譯階段生成的”.s”檔案轉成二進位制目的碼. 

選項 -c 

用法:[root]# gcc –c hello.s –o hello.o 

作用:將彙編輸出檔案test.s編譯輸出test.o檔案。 

[root]# gcc -c hello.s -o hello.o 

[root]# ls 

hello.c  hello.i  hello.o  hello.s 


4)連結階段(Link) 

在成功編譯之後,就進入了連結階段。 

無選項鍊接 

用法:[root]# gcc hello.o –o hello.exe 

作用:將編譯輸出檔案hello.o連結成最終可執行檔案hello.exe。 

[root]# ls 

hello.c  hello.exe  hello.i  hello.o  hello.s 

執行該可執行檔案,出現正確的結果如下。 

[root@localhost Gcc]# ./hello 

Hello World! 

在這裡涉及到一個重要的概念:函式庫。 

讀者可以重新檢視這個小程式,在這個程式中並沒有定義”printf”的函式實現,且在預編譯中包含進的”stdio.h”中也只有該函式的宣告,而沒有定義函式的實現,那麼,是在哪裡實現”printf”函式的呢?最後的答案是:系統把這些函式實現都被做到名為libc.so.6的庫檔案中去了,在沒有特別指定時,gcc會到系統預設的搜尋路徑”/usr/lib”下進行查詢,也就是連結到libc.so.6庫函式中去,這樣就能實現函式”printf” 了,而這也就是連結的作用。 

你可以用ldd命令檢視動態庫載入情況: 

[root]# ldd hello.exe 

libc.so.6 => /lib/tls/libc.so.6 (0x42000000) 

/lib/ld-linux.so.2 => /lib/ld-linux.so.2 (0x40000000) 

函式庫一般分為靜態庫和動態庫兩種。靜態庫是指編譯連結時,把庫檔案的程式碼全部加入到可執行檔案中,因此生成的檔案比較大,但在執行時也就不再需要庫檔案了。其字尾名一般為”.a”。動態庫與之相反,在編譯連結時並沒有把庫檔案的程式碼加入到可執行檔案中,而是在程式執行時由執行時連結檔案載入庫,這樣可以節省系統的開銷。動態庫一般字尾名為”.so”,如前面所述的libc.so.6就是動態庫。gcc在編譯時預設使用動態庫。

相關文章