C語言編譯過程簡介

Roninwz發表於2017-09-21

C語言編譯過程簡介

剛開始接觸程式設計的時候,只知道照書敲敲程式碼,一直都不知道為什麼在windows平臺下程式碼經過滑鼠那樣點選幾下,程式的結果就會在那個黑色的螢幕上。現在找了個機會將C語言的編譯原理做一下小小的總結,這樣也能為以後我們進軍linux程式設計做一些準備工作,現在這裡和大家一起分享分享。O(_)O~

講到編譯原理,我覺得首先我們得明白一些基本概念。

1.                   編輯器:我們編寫程式碼的一些視窗,如:記事本、wordnotepad 等。

2.                   編譯器:檢查使用者程式碼的一些語法錯誤並且將其編譯成彙編程式碼。

3.                   彙編器:將編譯出來的檔案變成目的碼(windows 下的.obj檔案)

4.                   聯結器:將目的碼連線成為可執行檔案(.exe),及雙擊就可以執行檔案。

5.                   整合開發環境(Integrated Development Environment,簡稱IDE):是用於程式開發環境的應用程式,一般包括程式碼編輯器、編譯器、偵錯程式和圖形使用者介面工具。如:VC6.0C_Free等。

好了,下面大家來看看整個過程吧:如圖片
Ok!現在是不是對程式的編譯有一點概念了,O(∩_∩)O~。現在稍微總結一下編譯的完整過程吧:
       C源程式-->預編譯處理(.c)-->編譯、優化程式(.s.asm)-->彙編程式(.obj.o.a.ko)-->連結程式(.exe.elf.axf等)。
好了,現在我們就來逐條瞭解一下每個過程吧。
1.      C源程式
             這個大家都清楚了,那就是自己編寫程式程式碼。
2.  預編譯處理(.c)
它主要包括四個過程
a、巨集定義指令,如#define N 6,#undef等。
             對於前一個偽指令,預編譯所要做的是將程式中的所有N用6替換,請大家注意這裡是替換,並不是像作為函式引數那樣將6複製進N這個變數。對於後者,則將取消對某個巨集的定義,使以後出現的N不再被替換。
             b、條件編譯指令,如#ifdef,#ifndef,#endif等。
             這些偽指令的引入使得程式設計師可以通過定義不同的巨集來決定編譯程式對哪些程式碼進行處理。預編譯程式將根據有關的檔案,將那些不必要的程式碼過濾掉。這樣就能在編譯階段減少編譯時間,提高效率,看看這是多好的指令。O(∩_∩)O~
              c、 標頭檔案包含指令,如#include "file.h"或#include <file.h>等。
               在標頭檔案中一般用偽指令#define定義了大量的巨集(最常見的是字元常量),同時包含有各種外部符號的宣告。
         採用這樣的做法一來可以讓我們直接呼叫一些複雜庫函式;二來可以免去我們在寫程式時重複做一些定義宣告工作的麻煩。試想一下,一旦我們寫好標頭檔案,那麼以後要用到相關模組就再也不用寫這些函式了,直接#include 就OK了,這可是一勞永逸啊,天大的便宜呢,呵呵。
             對了,這裡順便提一下#include<>與#include“”的區別。
             #include<>:這條指令就是告訴編譯器去系統預設的路徑尋找相關檔案。
#include”” :這條是告訴編譯器先去源程式所在目錄下尋找,如果沒有就去系統預設路徑尋找。
            d、特殊符號,預編譯程式可以識別一些特殊的符號。
             例如在源程式中出現的LINE標識將被解釋為當前行號(十進位制數),FILE則被解釋為當前被編譯的C源程式的名稱。預編譯程式就是對在源程式中出現的這些特殊符號將用合適的值進行替換。
   大家注意到沒,預編譯階段基本上是完成對源程式的相關程式碼進行替換,這樣之後程式的原意沒有改變,就是程式碼的內容有所不同,這樣為以後的編譯做好準備,ok,第二階段完滿結束,嘿嘿!
3.      編譯、優化程式(.s.asm
             經過上一階段的處理,現在我們的程式已經沒有巨集定義,包含標頭檔案等指令了,只剩下一些變數,常量,關鍵字等,而編譯的主要作用是檢查這些程式碼的語法錯誤及將這些程式碼編譯成為彙編檔案。
             優化程式這是很複雜的,不僅和編譯技術本身有關,還和目標板相應的硬體環境有很大的關係。如下面的程式碼:
int a,b,c; 
a = inWord(0x100); /*讀取 I/O 空間 0x100 埠的內容存入 a 變數*/ 
b = a; 
a = inWord (0x100); /*再次讀取 I/O 空間0x100埠的內容存入 a 變數*/ 
c = a;
很可能被編譯器優化為:
int a,b,c; 
a = inWord(0x100); /*讀取 I/O 空間 0x100 埠的內容存入 a 變數*/ 
b = a; 
c = a;
也正是由於這種編譯器優化作用才使關鍵字volatile有了這麼大的用武之地,當然這只是原因之一。
4.      彙編程式(.obj.o.a.ko)
在這個階段是將彙編程式碼翻譯成目標檔案,這時的檔案已經是二進位制程式碼了。在windows環境下檔案的字尾名是.obj;而在unix下則有是o、.a、.ko等檔案。
目標檔案由段組成。通常一個目標檔案中至少有兩個段:
          程式碼段:該段中所包含的主要是程式的指令。該段一般是可讀和可執行的,但一般卻不可寫。
     資料段:主要存放程式中要用到的各種全域性變數或靜態的資料。一般資料段都是可讀,可寫,可執行的。
5.      連結程式(.exe.elf.axf
也許有人會有疑問,上面的目的碼已經是機器碼了,也就是說CPU可以識別這些檔案了,那為什麼我們還要連結程式呢?大家想想我們是不是忘了點什麼。。。對!那些被包含的標頭檔案,以及當我們的程式分佈於很多原始檔時,那麼這些原始檔該怎麼處理呢,這就是聯結器的作用,它們被翻譯成目的碼後需要被連結到一起才能被執行。這樣就ok了,嘿嘿!
談到函式庫的連結,我們還需要了解點函式庫的知識,函式庫分靜態連結庫(又稱靜態庫*.lib)和連結動態庫(又稱動態庫*.dll)。
靜態庫的連結在編譯時會被編譯進彙編檔案,這樣的操作會改變檔案大小;而動態庫則是在執行時(雙擊執行),當需要動態庫中的檔案時才被連結到可執行檔案的。

               Ok!總結就到這裡吧,希望對大家能有所幫助,O(∩_∩)O~~~~




轉載來自:http://blog.csdn.net/chengocean/article/details/6250779

相關文章