windows dll 和 Linux so 的異同

查志強發表於2014-06-08

【原文:http://blog.sina.com.cn/s/blog_4b09f3db0101bz9t.html

windows dll 和 Linux so 的異同

       摘要:動態連結庫技術實現和設計程式常用的技術,在Windows和Linux系統中都有動態庫的概念,採用動態庫可以有效的減少程式大小,節省空間,提高效率,增加程式的可擴充套件性,便於模組化管理。

但不同作業系統的動態庫由於格式 不同,在需要不同作業系統呼叫時需要進行動態庫程式移植。本文分析和比較了兩種作業系統動態庫技術,並給出了將Visual C++編制的動態庫移植到Linux上的方法和經驗。

1、引言

動態庫(Dynamic Link Library abbr,DLL)技術是程式設計中經常採用的技術。其目的減少程式的大小,節省空間,提高效率,具有很高的靈活性。

採用動態庫技術對於升級軟體版本更加容易。與靜態庫(Static Link Library)不同,動態庫裡面的函式不是執行程式本身的一部分,而是根據執行需要按需載入,其執行程式碼可以同時在多個程式中共享。

在Windows和Linux作業系統中,都可採用這種方式進行軟體設計,但他們的呼叫方式以及程式編制方式不盡相同。本文首先分析了在這兩種作業系統中通常採用的動態庫呼叫方法以及程式編制方式,然後分析比較了這兩種方式的不同之處,最後根據實際移植程式經驗,介紹了將VC++編制的Windows動態庫移植到Linux下的方法。

2、動態庫技術

2.1 Windows動態庫技術

動態連結庫是實現Windows應用程式共享資源、節省記憶體空間、提高使用效率的一個重要技術手段。常見的動態庫包含外部函式和資源,也有一些動態庫只包含資源,如Windows字型資原始檔,稱之為資源動態連結庫。通常動態庫以.dll,.drv、.fon等作為字尾。

相應的windows靜態庫通常以.lib結尾,Windows自己就將一些主要的系統功能以動態庫模組的形式實現。

Windows動態庫在執行時被系統載入到程式的虛擬空間中,使用從呼叫程式的虛擬地址空間分配的記憶體,成為呼叫程式的一部分。DLL也只能被該程式的執行緒所訪問。DLL的控制程式碼可以被呼叫程式使用;呼叫程式的控制程式碼可以被DLL使用。

DLL模組中包含各種匯出函式,用於向外界提供服務。DLL可以有自己的資料段,但沒有自己的堆疊,使用與呼叫它的應用程式相同的堆疊模式;一個DLL在記憶體中只有一個例項;DLL實現了程式碼封裝性;DLL的編制與具體的程式語言及編譯器無關,可以通過DLL來實現混合語言程式設計。DLL函式中的程式碼所建立的任何物件(包括變數)都歸呼叫它的執行緒或程式所有。

根據呼叫方式的不同,對動態庫的呼叫可分為靜態呼叫方式和動態呼叫方式。

(1)靜態呼叫,也稱為隱式呼叫,由編譯系統完成對DLL的載入和應用程式結束時DLL解除安裝的編碼(Windows系統負責對DLL呼叫次數的計數),呼叫方式簡單,能夠滿足通常的要求。通常採用的呼叫方式是把產生動態連線庫時產生的.LIB檔案加入到應用程式的工程中,想使用DLL中的函式時,只須在原始檔中宣告一下。

LIB檔案包含了每一個DLL匯出函式的符號名和可選擇的標識號以及DLL檔名,不含有實際的程式碼。Lib檔案包含的資訊進入到生成的應用程式中,被呼叫的DLL檔案會在應用程式載入時同時載入在到記憶體中。

(2)動態呼叫,即顯式呼叫方式,是由程式設計者用API函式載入和解除安裝DLL來達到呼叫DLL的目的,比較複雜,但能更加有效地使用記憶體,是編制大型應用程式時的重要方式。在Windows系統中,與動態庫呼叫有關的函式包括:

①LoadLibrary(或MFC 的AfxLoadLibrary),裝載動態庫。

②GetProcAddress,獲取要引入的函式,將符號名或標識號轉換為DLL內部地址。

③FreeLibrary(或MFC的AfxFreeLibrary),釋放動態連結庫。

在 windows中建立動態庫也非常方便和簡單。在VisualC++中,可以建立不用MFC而直接用C語言寫的DLL程式,也可以建立基於MFC類庫的DLL程式。每一個DLL必須有一個入口點,在VC++中,DllMain是一個預設的入口函式。DllMain負責初始化(Initialization)和結束(Termination)工作。

動態庫輸出函式也有兩種約定,分別是基於呼叫約定和名字修飾約定。DLL程式定義的函式分為內部函式和匯出函式,動態庫匯出的函式供其它程式模組呼叫。通常可以有下面幾種方法匯出函式:

①採用模組定義檔案的EXPORT部分指定要輸入的函式或者變數。

②使用MFC提供的修飾符號_declspec(dllexport)。

③以命令列方式,採用/EXPORT命令列輸出有關函式。

在windows動態庫中,有時需要編寫模組定義檔案(.DEF),它是用於描述DLL屬性的模組語句組成的文字檔案。

2.2 Linux共享物件技術

在 Linux作業系統中,採用了很多共享物件技術(SharedObject),雖然它和Windows裡的動態庫相對應,但它並不稱為動態庫。相應的共享物件檔案以.so作為字尾,為了方便,在本文中,對該概念不進行專門區分。Linux系統的/lib以及標準圖形介面的/usr/X11R6/lib等目錄裡面,就有許多以so結尾的共享物件。

同樣,在Linux下,也有靜態函式庫這種呼叫方式,相應的字尾以.a結束。Linux採用該共享物件技術以方便程式間共享,節省程式佔有空間,增加程式的可擴充套件性和靈活性。Linux還可以通過LD-PRELOAD變數讓開發人員可以使用自己的程式庫中的模組來替換系統模組。

同Windows系統一樣,在Linux中建立和使用動態庫是比較容易的事情,在編譯函式庫源程式時加上-shared選項即可,這樣所生成的執行程式就是動態連結庫。通常這樣的程式以so為字尾,在Linux動態庫程式設計過程中,通常流程是編寫使用者的介面檔案,通常是.h檔案,編寫實際的函式檔案,以.c或.cpp為字尾,再編寫makefile檔案。對於較小的動態庫程式可以不用如此,但這樣設計使程式更加合理。

編譯生成動態連線庫後,進而可以在程式中進行呼叫。在Linux中,可以採用多種呼叫方式,同Windows的系統目錄(..\system32等)一樣,可以將動態庫檔案拷貝到/lib目錄或者在/lib目錄裡面建立符號連線,以便所有使用者使用。

下面介紹Linux呼叫動態庫經常使用的函式,但在使用動態庫時,源程式必須包含dlfcn.h標頭檔案,該檔案定義呼叫動態連結庫的函式的原型。

(1)_開啟動態連結庫:dlopen,函式原型void *dlopen (const char *filename, int flag); dlopen用於開啟指定名字(filename)的動態連結庫,並返回操作控制程式碼。

(2)取函式執行地址:dlsym,函式原型為: void *dlsym(void *handle, char *symbol); dlsym根據動態連結庫操作控制程式碼(handle)與符號(symbol),返回符號對應的函式的執行程式碼地址。

(3)關閉動態連結庫:dlclose,函式原型為: int dlclose (void *handle); dlclose用於關閉指定控制程式碼的動態連結庫,只有當此動態連結庫的使用計數為0時,才會真正被系統解除安裝。

(4)動態庫錯誤函式:dlerror,函式原型為: const char *dlerror(void); 當動態連結庫操作函式執行失敗時,dlerror可以返回出錯資訊,返回值為NULL時表示操作函式執行成功。

在取到函式執行地址後,就可以在動態庫的使用程式裡面根據動態庫提供的函式介面宣告呼叫動態庫裡面的函式。在編寫呼叫動態庫的程式的makefile檔案時,需要加入編譯選項-rdynamic和-ldl。

除了採用這種方式編寫和呼叫動態庫之外,Linux作業系統也提供了一種更為方便的動態庫呼叫方式,也方便了其它程式呼叫,這種方式與Windows系統的隱式連結類似。其動態庫命名方式為“lib*.so.*”。在這個命名方式中,第一個*表示動態連結庫的庫名,第二個*通常表示該動態庫的版本號,也可以沒有版本號。

在這種呼叫方式中,需要維護動態連結庫的配置檔案/etc/ld.so.conf來讓動態連結庫為系統所使用,通常將動態連結庫所在目錄名追加到動態連結庫配置檔案中。如具有Xwindow視窗系統發行版該檔案中都具有/usr/X11R6/lib,它指向X window視窗系統的動態連結庫所在目錄。

為了使動態連結庫能為系統所共享,還需執行動態連結庫的管理命令./sbin/ldconfig。在編譯所引用的動態庫時,可以在gcc採用 –l或-L選項或直接引用所需的動態連結庫方式進行編譯。在Linux裡面,可以採用ldd命令來檢查程式依賴共享庫。

3、兩種系統動態庫比較分析

Windows和Linux採用動態連結庫技術目的是基本一致的,但由於作業系統的不同,他們在許多方面還是不盡相同,下面從以下幾個方面進行闡述。

(1)動態庫程式編寫,在Windows系統下的執行檔案格式是PE格式,動態庫需要一個DllMain函式作為初始化的人口,通常在匯出函式的宣告時需要有_declspec(dllexport)關鍵字。Linux下的gcc編譯的執行檔案預設是ELF格式,不需要初始化入口,亦不需要到函式做特別宣告,編寫比較方便。

(2)動態庫編譯,在windows系統下面,有方便的除錯編譯環境,通常不用自己去編寫makefile檔案,但在linux下面,需要自己動手去編寫makefile檔案,因此,必須掌握一定的makefile編寫技巧,另外,通常Linux編譯規則相對嚴格。

(3)動態庫呼叫方面,Windows和Linux對其下編制的動態庫都可以採用顯式呼叫或隱式呼叫,但具體的呼叫方式也不盡相同。

(4)動態庫輸出函式檢視,在Windows中,有許多工具和軟體可以進行檢視DLL中所輸出的函式,例如命令列方式的dumpbin以及VC++工具中的DEPENDS程式。在Linux系統中通常採用nm來檢視輸出函式,也可以使用ldd檢視程式隱式連結的共享物件檔案。

(5)對作業系統的依賴,這兩種動態庫執行依賴於各自的作業系統,不能跨平臺使用。因此,對於實現相同功能的動態庫,必須為兩種不同的作業系統提供不同的動態庫版本。

4、動態庫移植方法

如果要編制在兩個系統中都能使用的動態連結庫,通常會先選擇在Windows的VC++提供的除錯環境中完成初始的開發,畢竟VC++提供的圖形化編輯和除錯介面比vi和gcc方便許多。完成測試之後,再進行動態庫的程式移植。

通常gcc預設的編譯規則比VC++預設的編譯規則嚴格,即使在VC++下面沒有任何警告錯誤的程式在gcc除錯中也會出現許多警告錯誤,可以在gcc中採用-w選項關閉警告錯誤。

下面給出程式移植需要遵循的規則以及經驗。

(1)儘量不要改變原有動態庫標頭檔案的順序。通常在C/C++語言中,標頭檔案的順序有相當的關係。另外雖然C/C++語言區分大小寫,但在包含標頭檔案時,Linux必須與標頭檔案的大小寫相同,因為ext2檔案系統對檔名是大小寫敏感,否則不能正確編譯,而在Windows下面,標頭檔案大小寫可以正確編譯。

(2)不同系統獨有的標頭檔案。在Windows系統中,通常會包括windows.h標頭檔案,如果呼叫底層的通訊函式,則會包含winsock..h標頭檔案。因此在移植到Linux系統時,要註釋掉這些Windows系統獨有的標頭檔案以及一些windows系統的常量定義說明,增加Linux都底層通訊的支援的標頭檔案等。

(3)資料型別。VC++具有許多獨有的資料型別,如__int16,__int32,TRUE,SOCKET等,gcc編譯器不支援它們。通常做法是需要將windows.h和basetypes.h中對這些資料進行定義的語句複製到一個標頭檔案中,再在Linux中包含這個標頭檔案。例如將套接字的型別為SOCKET改為int。

(4)關鍵字。VC++中具有許多標準C中所沒有采用的關鍵字,如BOOL,BYTE,DWORD,__asm等,通常在為了移植方便,儘量不使用它們,如果實在無法避免可以採用#ifdef 和#endif為LINUX和WINDOWS編寫兩個版本。

(5)函式原型的修改。通常如果採用標準的C/C++語言編寫的動態庫,基本上不用再重新編寫函式,但對於系統呼叫函式,由於兩種系統的區別,需要改變函式的呼叫方式等,如在Linux編制的網路通訊動態庫中,用close()函式代替windows作業系統下的closesocket()函式來關閉套接字。另外在Linux下沒有檔案控制程式碼,要開啟檔案可用open和fopen函式,具體這兩個函式的用法可參考文獻[2]。

(6)makefile的編寫。在windows下面通常由VC++編譯器來負責除錯,但gcc需要自己動手編寫makefile檔案,也可以參照VC++生成的makefile檔案。對於動態庫移植,編譯動態庫時需要加入-shared選項。對於採用數學函式,如冪級數的程式,在呼叫動態庫是,需要加入-lm。

(7)其它一些需要注意的地方

①程式設計結構分析,對於移植它人編寫的動態庫程式,程式結構分析是必不可少的步驟,通常在動態庫程式中,不會包含介面等操作,所以相對容易一些。

②在Linux中,對檔案或目錄的許可權分為擁有者、群組、其它。所以在存取檔案時,要注意對檔案是讀還是寫操作,如果是對檔案進行寫操作,要注意修改檔案或目錄的許可權,否則無法對檔案進行寫。

③指標的使用,定義一個指標只給它分配四個位元組的記憶體,如果要對指標所指向的變數賦值,必須用malloc函式為它分配記憶體或不把它定義為指標而定義為變數即可,這點在linux下面比windows編譯嚴格。同樣結構不能在函式中傳值,如果要在函式中進行結構傳值,必須把函式中的結構定義為結構指標。

④路徑識別符號,在Linux下是“/”,在Windows下是“\”,注意windows和Linux的對動態庫搜尋路徑的不同。

⑤程式設計和除錯技巧方面。對不同的除錯環境有不同的除錯技巧,在這裡不多敘述。

5、結束語

本文系統分析了windows和Linux動態庫實現和使用方式,從程式編寫、編譯、呼叫以及對作業系統依賴等方面綜合分析比較了這兩種呼叫方式的不同之處,根據實際程式移植經驗,給出了將VC++編制的Windows動態庫移植到Linux下的方法以及需要注意的問題,同時並給出了程式示例片斷,實際在程式移植過程中,由於系統的設計等方面,可能移植起來需要注意的方面遠比上面複雜,本文通過總結歸納進而為不同作業系統程式移植提供了有意的經驗和技巧。

(本文來源於internet,感謝原創作者)

--------------------------------------------------------------------------

unix具體編譯的例子:

原始檔為main.c, x.c, y.c, z.c,標頭檔案為x.h,y.h,z.h

# 聲稱動代連線庫,假設名稱為libtest.so
        gcc x.c y.c z.c -fPIC -shared -o libtest.so

        # 將main.c和動態連線庫進行連線生成可執行檔案
       gcc main.c -L. -ltest -o main

        # 輸出LD_LIBRARY_PATH環境變數,一邊動態庫裝載器能夠找到需要的動態庫
        export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:.

        # 測試是否動態連線,如果列出libtest.so,那麼應該是連線正常了
        ldd main

-fPIC:表示編譯為位置獨立的程式碼,不用此選項的話編譯後的程式碼是位置相關的所以動態載入時是通  過   程式碼拷貝的方式來滿足不同程式的需要,而不能達到真正程式碼段共享的目的。

-L.:表示要連線的庫在當前目錄中

-ltest:編譯器查詢動態連線庫時有隱含的命名規則,即在給出的名字前面加上lib,後面加上.so來確定庫的名稱

LD_LIBRARY_PATH:這個環境變數指示動態聯結器可以裝載動態庫的路徑。
當然如果有root許可權的話,可以修改/etc/ld.so.conf檔案,然後呼叫
/sbin/ldconfig來達到同樣的目的,不過如果沒有root許可權,那麼只能採用輸出LD_LIBRARY_PATH的方法了

相關文章