gcc 簡介(轉)

post0發表於2007-08-11
gcc 簡介(轉)[@more@]

本節學習GNU推出的Linux系統下C編譯器----gcc,主要介紹這種編譯器的基本原理和使用方法,以及編譯過程中所產生的錯誤的原因及對策。

gcc簡介

Linux系統下的gcc(GNU C Compiler)是GNU推出的功能強大、效能優越的多平臺編譯器,是GNU的代表作品之一。gcc是可以在多種硬體平臺上編譯出可執行程式的超級編譯器,其執行效率與一般的編譯器相比平均效率要高20%~30%。

gcc編譯器能將C、C++語言源程式、匯程式化序和目標程式編譯、連線成可執行檔案,如果沒有給出可執行檔案的名字,gcc將生成一個名為a.out的檔案。在Linux系統中,可執行檔案沒有統一的字尾,系統從檔案的屬性來區分可執行檔案和不可執行檔案。而gcc則透過字尾來區別輸入檔案的類別,下面我們來介紹gcc所遵循的部分約定規則。

.c為字尾的檔案,C語言原始碼檔案;

.a為字尾的檔案,是由目標檔案構成的檔案庫檔案;

.C,.cc或.cxx 為字尾的檔案,是C++原始碼檔案;

.h為字尾的檔案,是程式所包含的標頭檔案;

.i 為字尾的檔案,是已經預處理過的C原始碼檔案;

.ii為字尾的檔案,是已經預處理過的C++原始碼檔案;

.m為字尾的檔案,是Objective-C原始碼檔案;

.o為字尾的檔案,是編譯後的目標檔案;

.s為字尾的檔案,是組合語言原始碼檔案;

.S為字尾的檔案,是經過預編譯的組合語言原始碼檔案。

gcc的執行過程

雖然我們稱gcc是C語言的編譯器,但使用gcc由C語言原始碼檔案生成可執行檔案的過程不僅僅是編譯的過程,而是要經歷四個相互關聯的步驟∶預處理(也稱預編譯,Preprocessing)、編譯(Compilation)、彙編(Assembly)和連線(Linking)。

命令gcc首先呼叫cpp進行預處理,在預處理過程中,對原始碼檔案中的檔案包含(include)、預編譯語句(如宏定義define等)進行分析。接著呼叫cc1進行編譯,這個階段根據輸入檔案生成以.o為字尾的目標檔案。彙編過程是針對組合語言的步驟,呼叫as進行工作,一般來講,.S為字尾的組合語言原始碼檔案和彙編、.s為字尾的組合語言檔案經過預編譯和彙編之後都生成以.o為字尾的目標檔案。當所有的目標檔案都生成之後,gcc就呼叫ld來完成最後的關鍵性工作,這個階段就是連線。在連線階段,所有的目標檔案被安排在可執行程式中的恰當的位置,同時,該程式所呼叫到的庫函式也從各自所在的檔案庫中連到合適的地方。

gcc的基本用法和選項

在使用gcc編譯器的時候,我們必須給出一系列必要的呼叫引數和檔名稱。gcc編譯器的呼叫引數大約有100多個,其中多數引數我們可能根本就用不到,這裡只介紹其中最基本、最常用的引數。

gcc最基本的用法是∶gcc [options] [filenames]

其中options就是編譯器所需要的引數,filenames給出相關的檔名稱。

-c,只編譯,不連線成為可執行檔案,編譯器只是由輸入的.c等原始碼檔案生成.o為字尾的目標檔案,通常用於編譯不包含主程式的子程式檔案。

-o output_filename,確定輸出檔案的名稱為output_filename,同時這個名稱不能和原始檔同名。如果不給出這個選項,gcc就給出預設的可執行檔案a.out。

-g,產生符號除錯工具(GNU的gdb)所必要的符號資訊,要想對原始碼進行除錯,我們就必須加入這個選項。

-O,對程式進行最佳化編譯、連線,採用這個選項,整個原始碼會在編譯、連線過程中進行最佳化處理,這樣產生的可執行檔案的執行效率可以提高,但是,編譯、連線的速度就相應地要慢一些。

-O2,比-O更好的最佳化編譯、連線,當然整個編譯、連線過程會更慢。

-Idirname,將dirname所指出的目錄加入到程式標頭檔案目錄列表中,是在預編譯過程中使用的引數。C程式中的標頭檔案包含兩種情況∶

A)#include

B)#include “myinc.h”

其中,A類使用尖括號(< >),B類使用雙引號(“ ”)。對於A類,預處理程式cpp在系統預設包含檔案目錄(如/usr/include)中搜尋相應的檔案,而對於B類,cpp在當前目錄中搜尋標頭檔案,這個選項的作用是告訴cpp,如果在當前目錄中沒有找到需要的檔案,就到指定的dirname目錄中去尋找。在程式設計中,如果我們需要的這種包含檔案分別分佈在不同的目錄中,就需要逐個使用-I選項給出搜尋路徑。

-Ldirname,將dirname所指出的目錄加入到程式函式檔案庫檔案的目錄列表中,是在連線過程中使用的引數。在預設狀態下,連線程式ld在系統的預設路徑中(如/usr/lib)尋找所需要的檔案庫檔案,這個選項告訴連線程式,首先到-L指定的目錄中去尋找,然後到系統預設路徑中尋找,如果函式庫存放在多個目錄下,就需要依次使用這個選項,給出相應的存放目錄。

-lname,在連線時,裝載名字為“libname.a”的函式庫,該函式庫位於系統預設的目錄或者由-L選項確定的目錄下。例如,-lm表示連線名為“libm.a”的數學函式庫。

上面我們簡要介紹了gcc編譯器最常用的功能和主要引數選項,更為詳盡的資料可以參看Linux系統的聯機幫助。

假定我們有一個程式名為test.c的C語言原始碼檔案,要生成一個可執行檔案,最簡單的辦法就是∶

gcc test.c

這時,預編譯、編譯連線一次完成,生成一個系統預設的名為a.out的可執行檔案,對於稍為複雜的情況,比如有多個原始碼檔案、需要連線檔案庫或者有其他比較特別的要求,就要給定適當的呼叫選項引數。再看一個簡單的例子。

整個原始碼程式由兩個檔案testmain.c 和testsub.c組成,程式中使用了系統提供的數學庫,同時希望給出的可執行檔案為test,這時的編譯命令可以是∶

gcc testmain.c testsub.c □lm □o test

其中,-lm表示連線系統的數學庫libm.a,這個過程可以用圖12-1框圖描述。

gcc的錯誤型別及對策

gcc編譯器如果發現源程式中有錯誤,就無法繼續進行,也無法生成最終的可執行檔案。為了便於修改,gcc給出錯誤資訊,我們必須對這些錯誤資訊逐個進行分析、處理,並修改相應的語言,才能保證原始碼的正確編譯連線。gcc給出的錯誤資訊一般可以分為四大類,下面我們分別討論其產生的原因和對策。

第一類∶C語法錯誤

錯誤資訊∶檔案source.c中第n行有語法錯誤(syntex errror)。這種型別的錯誤,一般都是C語言的語法錯誤,應該仔細檢查原始碼檔案中第n行及該行之前的程式,有時也需要對該檔案所包含的標頭檔案進行檢查。有些情況下,一個很簡單的語法錯誤,gcc會給出一大堆錯誤,我們最主要的是要保持清醒的頭腦,不要被其嚇倒,必要的時候再參考一下C語言的基本教材。

第二類∶標頭檔案錯誤

錯誤資訊∶找不到標頭檔案head.h(Can not find include file head.h)。這類錯誤是原始碼檔案中的包含標頭檔案有問題,可能的原因有標頭檔案名錯誤、指定的標頭檔案所在目錄名錯誤等,也可能是錯誤地使用了雙引號和尖括號。

第三類∶檔案庫錯誤

錯誤資訊∶連線程式找不到所需的函式庫,例如∶

ld: -lm: No such file or directory

這類錯誤是與目標檔案相連線的函式庫有錯誤,可能的原因是函式庫名錯誤、指定的函式庫所在目錄名稱錯誤等,檢查的方法是使用find命令在可能的目錄中尋找相應的函式庫名,確定檔案庫及目錄的名稱並修改程式中及編譯選項中的名稱。

第四類∶未定義符號

錯誤資訊∶有未定義的符號(Undefined symbol)。這類錯誤是在連線過程中出現的,可能有兩種原因∶一是使用者自己定義的函式或者全域性變數所在原始碼檔案,沒有被編譯、連線,或者乾脆還沒有定義,這需要使用者根據實際情況修改源程式,給出全域性變數或者函式的定義體;二是未定義的符號是一個標準的庫函式,在源程式中使用了該庫函式,而連線過程中還沒有給定相應的函式庫的名稱,或者是該檔案庫的目錄名稱有問題,這時需要使用檔案庫維護命令ar檢查我們需要的庫函式到底位於哪一個函式庫中,確定之後,修改gcc連線選項中的-l和-L項。

排除編譯、連線過程中的錯誤,應該說這只是程式設計中最簡單、最基本的一個步驟,可以說只是開了個頭。這個過程中的錯誤,只是我們在使用C語言描述一個演算法中所產生的錯誤,是比較容易排除的。我們寫一個程式,到編譯、連線透過為止,應該說剛剛開始,程式在執行過程中所出現的問題,是演算法設計有問題,說得更玄點是對問題的認識和理解不夠,還需要更加深入地測試、除錯和修改。一個程式,稍為複雜的程式,往往要經過多次的編譯、連線和測試、修改。下面我們學習的程式維護、除錯工具和版本維護就是在程式除錯、測試過程中使用的,用來解決調測階段所出現的問題。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/8225414/viewspace-944672/,如需轉載,請註明出處,否則將追究法律責任。