在多道程式環境中,要想將一個使用者原始碼變成一個可以在記憶體中執行的程式,通常分為三個步驟:編譯、連結、載入。
(1)編譯:由編譯程式將使用者的原始碼編譯成若干個目標模組。
(2)連結:由連結程式將編譯後形成的一組目標模組以及它們所需要的庫函式連結在一起,形成一個完整的載入模組。
(3)載入:由載入程式將載入模組載入記憶體。
編譯和連結都是為將使用者程式從硬碟上調入記憶體並將其轉換為可執行程式服務的。用編譯器時的compile就是在進行編譯,link就是連結,執行程式時可以看到。
編譯可以理解為高階語言翻譯為計算機可以理解的二進位制程式碼,即機器語言。
連結可以舉例解釋:一個程式編譯後,在作業地址空間中所得到目標模組的起始地址通常是0,假設在1000處有一條指令load 1, 2500,即將2500單元處的資料取至暫存器1中。在多道程式環境下,將程式載入記憶體時並不可能預先知道所編譯的模組應該放在記憶體的何處。假設程式被載入從10000開始的地址,此時的2500就應該變成了12500,這裡就出現問題了,需要修改指令中的相對地址,但此時如果採用動態連結就可以不用修改地址,靈活地解決這個問題了。
連結分三種:靜態連結、載入時動態連結、執行時動態連結,現在流行的是執行時動態連結,這種不僅可以回憶程式的載入過程,而且節省了大量的記憶體空間。
再來看C/C++的編譯和連結:
無論是C/C++,首先要把原始檔編譯成中間程式碼檔案,在Windows下面就是.obj檔案,Unix、Linux下面就是.o檔案,即Object File,這個動作叫編譯(compile)。然後再把大量的Object File合成執行檔案,這個動作叫作連結(link)。
編譯時,編譯器需要的是語法的正確,函式與變數的宣告的正確。對於後者,通常是你需要告訴編譯器標頭檔案的所在位置(標頭檔案中應該只是宣告,而定義應該放在C/C++檔案中),只要所有的語法正確,編譯器就可以編譯出中間目標檔案。一般來說,每個原始檔都應該對應於一箇中間目標檔案(.o檔案或是.obj檔案)。
連結時,主要是連結函式和全域性變數,所以,我們可以使用這些中間目標檔案(.o檔案或是.obj檔案)來連結我們的應用程式。連結器並不管函式所在的原始檔,只管函式的中間目標檔案(Object File),在大多數時候,由於原始檔太多,編譯生成的中間目標檔案太多,而在連結時需要明顯地指出中間目標檔名,這對於編譯很不方便,所以,我們要給中間目標檔案打個包,在Windows下這種包叫“庫檔案”(Library File),也就是 .lib 檔案,在UNIX下,是Archive File,也就是.a檔案。
總而言之,連結就是那些目標檔案之間相互連結自己所需要的函式和全域性變數,而函式可能來源於其他目標檔案或庫檔案。
總結一下,原始檔首先會生成中間目標檔案,再由中間目標檔案生成執行檔案。在編譯時,編譯器只檢測程式語法,和函式、變數是否被宣告。如果函式未被宣告,編譯器會給出一個警告,但可以生成Object File。而在連結程式時,連結器會在所有的Object File中找尋函式的實現,如果找不到,那到就會報連結錯誤碼(Linker Error),在VC下,這種錯誤一般是:Link 2001錯誤,意思說是說,連結器未能找到函式的實現,需要指定函式的Object File。