Linux系統基礎開發技術1:構建Linux 庫檔案

helloxchen發表於2010-12-23

Author:gnuhpc
WebSite:blog.csdn.net/gnuhpc

實驗環境:Ubuntu Linux 10.04 32bit


1.庫檔案簡介

庫檔案是一個包含了編譯後程式碼、資料的檔案,用於與程式其他程式碼連編,它可以使得程式模組化、編譯速度更快,並且易於更新。庫檔案分為三種(實質為兩種,在隨後兩句話有解釋):靜態庫(在程式之前就已經裝載進其中了)、共享庫(在程式啟動之時載入進去,在程式直接共享)、動態載入庫(dynamically loaded,DL)(在程式執行中任何時候都可以被載入程式序中使用,事實上DL並非是一個完全不同的庫型別,共享庫可以用作DL而被動態載入(靜態庫在Linux貌似無法用dlopen載入)。注意有些人使用dynamically linked libraries (DLLs)來指代共享庫,有些人使用DLL這個詞來形容任何可以被用作DL的庫檔案,這個請區分對待。

在具體使用中,我們應該多使用共享庫,這使得使用者可以獨立於使用該庫檔案的程式而更新庫。DL的確非常有用,但有時候我們可能並不需要那些靈活性,而對於靜態庫,由於更新起來實在費勁,我們一般不使用。

2.靜態庫的建立

靜態庫就是一堆普通的目標檔案(object file),習慣上靜態庫以.a為字尾,這是使用ar命令生成的。靜態庫允許使用者不用重新編譯程式碼就可以連結程式,以節省重新編譯的時間,其實這個時間已經在強大的機器配置和快速的編譯器中顯得微不足道了,這個常常用來提供程式而不是原始碼。速度上,靜態ELF(Executable and Linking Format)庫檔案比共享庫或者動態載入庫快1%-5%,但實際上常常因為其他因素而並不一定快。

我們寫主檔案prog.c:

1: #include
2: void ctest1(int *);
3: void ctest2(int *);
4:
5: int main()
6: {
7: int x;
8: ctest1(&x);
9: printf("Valx=%dn",x);
10:
11: return 0;
12: }
13: 然後寫這兩個函式的實現:

ctest1.c

1: void ctest1(int *i)
2: {
3: *i=5;
4: } ctest2.c

1: void ctest2(int *i)
2: {
3: *i=100;
4: }我們首先編譯這兩個函式實現的原始檔:

gcc -Wall -c ctest1.c ctest2.c
ls
ctest1.c ctest1.o ctest2.c ctest2.o prog.c

然後建立靜態庫libctest.a:

ar -cvq libctest.a ctest1.o ctest2.o

a - ctest1.o
a - ctest2.o

我們檢視一下這個庫中的檔案:

ar -t libctest.a
ctest1.o
ctest2.o

此時我們可以編譯我們的程式了,注意-l選項,後邊的引數是去掉lib和.a的部分,並且需要放在要編譯的檔名之後,否則會報錯。:

gcc -o test prog.c -L./ –lctest
ls
ctest1.c ctest1.o ctest2.c ctest2.o libctest.a prog.c test
./test
Valx=5

3.共享庫的建立

共享庫是在程式啟動時載入的庫檔案。當共享庫載入完畢後所有啟動的起來的程式都將使用新的共享庫。在建立共享庫之前,還需要了解一些知識:

命名規則:
每一個共享庫都有一個soname,一般都形如libname.so.versionNumber,其中versionNumber每當介面發生改變時都要增加,一個完全的soname的字首應該是它所在目錄,在一個實際系統中,一個完整的soname只是共享庫檔案的real name的符號連結。程式執行時在內部列出所需的共享庫時使用的就是soname。
每一個共享庫也有一個real name,這是包含實際程式碼的檔名,real name使用soname為字首,並且在後邊新增一些資訊,一般都形如soname.MinorNumber.ReleaseNumber。 最後的releaseNumber可有可無。這個是生成共享庫時實際檔案的名稱。
同時,在編譯器要求使用一個共享庫時使用的名字稱為linker name,一般都是去掉版本號的soname,用於gcc中-lname這樣的選項的編譯。
這幾個名字的關係:你在建立實際庫檔案中指定libreadline.so.3.0為real name ,並且使用符號連結建立soname ->libreadline.so.3和linker name-> /usr/lib/libreadline.so。
放置位置:
GNU標準推薦將所有預設的庫安裝在/usr/local/lib,這指的是開發者原始碼預設的位置。
FHS指出大多數的庫檔案應該放在/usr/lib,而啟動所需的庫則應該放在/lib中,而非系統庫應該放在/usr/local/lib。這指的是發行版預設的位置,這兩個標準並沒有矛盾。
共享庫的主要有三個步驟:

建立目的碼。
建立庫。
使用符號連結建立預設版本的共享庫(可選)。
現在我們舉個例子來說明,首先我們編譯原始碼,使用-fPIC選項生成共享庫所需的位置獨立程式碼(position-independent code (PIC)):

gcc -Wall -fPIC -c *.c
ls
ctest1.c ctest1.o ctest2.c ctest2.o prog.c prog.o

然後我們建立庫檔案:

gcc -shared -Wl,-soname,libctest.so.1 -o libctest.so.1.0 *.o
ls
ctest1.c ctest1.o ctest2.c ctest2.o libctest.so.1.0 prog.c prog.o

-shared選項指明生成共享目標檔案,-W1(注意是小寫L而不是一)指明傳入連結器的引數,在此我們設定了該庫的soname為libctest.so.1,-o則指明瞭生成的目標庫檔案為libctest.so.1.0(這個就是real name)。

最後建立所需的符號連結:

sudo mv libctest.so.1.0 /usr/local/lib/libctest.so.1.0
sudo ln -sf /usr/local/lib/libctest.so.1.0 /usr/local/lib/libctest.so.1
sudo ln -sf /usr/local/lib/libctest.so.1.0 /usr/local/lib/libctest.so

建立的libctest.so就是上面所謂linker name,用於編譯時-lctest選項。

建立的libctest.so.1就是soname,我們在上邊說過程式在執行時需要這個名字的符號連結。

此時我們的共享庫就建好了,接著我們編譯程式:

gcc -Wall -L/usr/local/lib prog.c -lctest -o prog
ls
ctest1.c ctest1.o ctest2.c ctest2.o prog prog.c prog.o

我們編譯完畢,該庫並不會包含在可執行檔案中,只有在執行時來會動態載入進來。我們可以透過ldd列出一個可執行程式所有的依賴,在我的系統中還找不到/usr/local/bin的路徑:

ldd prog
linux-gate.so.1 => (0x00a5c000)
libctest.so.1 => not found
libc.so.6 => /lib/tls/i686/cmov/libc.so.6 (0x00a6f000)
/lib/ld-linux.so.2 (0x00451000)

此時,執行會報找不到庫的錯誤:

./prog
./prog: error while loading shared libraries: libctest.so.1: cannot open shared object file: No such file or directory

我們可以將所需庫的路徑加入到系統路徑中,有三種方法可以完成:

A.在/etc/ld.so.conf中加入所在路徑,然後執行ldconfig配置連結器執行時繫結配置。你也可以建立一個檔案,將路徑寫入,然後使用ldconfig –f filename將配置寫入。
B.修改LD_LIBRARY_PATH環境變數(Linux下,AIX下為LIBPATH),在其中新增路徑。若你直接在.bashrc檔案中配置則重啟後不失效,否則在shell中設定重啟後失效。
我們使用A方法中的-f選項:

vi libctest.conf
sudo ldconfig -f libctest.conf
./prog
Valx=5
ldd prog
linux-gate.so.1 => (0x00f6f000)
libctest.so.1 => /usr/local/lib/libctest.so.1 (0x005d9000)
libc.so.6 => /lib/tls/i686/cmov/libc.so.6 (0x00718000)
/lib/ld-linux.so.2 (0x001e6000)

其中libctest.conf中寫入路徑:/usr/local/lib。程式執行正常。

4.動態載入庫的使用

動態載入庫是在非程式啟動時動態載入進入程式的庫,這對於實現外掛或動態模組有很大的幫助。在Linux中,動態載入庫的形式並不特殊,它使用上述兩種程式庫,使用提供的API在程式執行時動態載入。注意,在不同平臺上動態載入庫的API並不相同,所以可能會有移植問題出現。

我們可以透過nm命令先檢視一下我們建立的庫裡面有哪些symbol(可以理解為函式方法)供我們使用:

nm /usr/local/lib/libctest.so
00001f18 a _DYNAMIC
00001ff4 a _GLOBAL_OFFSET_TABLE_
w _Jv_RegisterClasses
00001f08 d __CTOR_END__
00001f04 d __CTOR_LIST__
00001f10 d __DTOR_END__
00001f0c d __DTOR_LIST__
000005a0 r __FRAME_END__
00001f14 d __JCR_END__
00001f14 d __JCR_LIST__
00002014 A __bss_start
w
00000540 t __do_global_ctors_aux
00000420 t __do_global_dtors_aux
00002010 d __dso_handle
w __gmon_start__
000004d7 t __i686.get_pc_thunk.bx
00002014 A _edata
0000201c A _end
00000578 T _fini
000003a0 T _init
00002014 b completed.7021
000004dc T ctest1
000004ec T ctest2
00002018 b dtor_idx.7023
000004a0 t frame_dummy
000004fc T main
U

這個命令對靜態庫和共享庫都支援,第二列為symbol型別,小寫字母表示符號是本地的,大寫字母表示符號是全域性(外部)的,幾個常見的字母含義如下:T為程式碼段普通定義,D為已初始化資料段,B為未初始化資料段,U為未定義(用到該符號但是沒有在該庫中定義)。

我們建立ctest.h:

1: #ifndef CTEST_H
2: #define CTEST_H
3:
4: #ifdef __cplusplus
5: extern "C" {
6: #endif
7:
8: void ctest1(int *);
9: void ctest2(int *);
10:
11: #ifdef __cplusplus
12: }
13: #endif
14:
15: #endif這裡使用extern C是為了使得該庫既可以用於C語言又可以用於C++。

我們動態載入庫進來:progdl.c

1: #include
2: #include
3: #include "ctest.h"
4:
5: int main(int argc, char **argv)
6: {
7: void *lib_handle;
8: double (*fn)(int *);
9: int x;
10: char *error;
11:
12: lib_handle = dlopen("/usr/local/lib/libctest.so", RTLD_LAZY);
13: if (!lib_handle)
14: {
15: fprintf(stderr, "%sn", dlerror());
16: exit(1);
17: }
18:
19: fn = dlsym(lib_handle, "ctest1");
20: if ((error = dlerror()) != NULL)
21: {
22: fprintf(stderr, "%sn", error);
23: exit(1);
24: }
25:
26: (*fn)(&x);
27: printf("Valx=%dn",x);
28:
29: dlclose(lib_handle);
30: return 0;
31: }裡面的方法解釋如下:

void * dlopen(const char *filename, int flag);
若filename為絕對路徑,那麼dlopen就會試圖開啟它而不搜尋相關路徑,否則就現在環境變數LD_LIBRARY_PATH處搜尋,然後在/etc/ld.so.cache以及/lib和/usr/lib搜尋。flag我們只解釋兩個常用的選項:若為RTLD_LAZY則表示在動態庫執行時解決未定義符號問題,而RTLD_NOW則表示在dlopen返回前解決未定義符號問題。當你除錯時你應該用RTLD_NOW,這個時候若存在未解決的引用程式還可以繼續進行。另外,RTLD_NOW選項可能會使開啟庫的這個操作稍微慢一點,但是以後尋找函式時就會快一點。注意,若程式庫相互依賴則應該按依賴順序依次載入,比如X依賴Y,那麼要先載入Y然後再載入X。返回的是一個控制程式碼,若失敗則返回null.

char *dlerror(void);
報告任何上一次對載入庫操作的錯誤。兩次呼叫期間若有操作錯誤則第二次會報告, 否則第二次則返回null——它報告完錯誤就等待下一個錯誤的發生,上一次錯誤的情況一旦報告就不再提及。

void *dlsym(void *handle, const char *symbol);
尋找對應symbol的函式方法,handle就是dlopen返回的控制程式碼。一般如下使用:
1: dlerror(); /* clear error code */
2: s = (actual_type) dlsym(handle, symbol_being_searched_for);
3: if ((err = dlerror()) != NULL) {
4: /* handle error, the symbol wasn't found */
5: } else {
6: /* symbol found, its value is in s */
7: }int dlclose(void *handle);
關閉一個動態載入庫。當一個動態庫被載入多次時,你需要用同樣次數dlclose該動態庫才可以deallocated.

我們編譯該程式碼gcc -g -rdynamic -o progdl progdl.c -ldl,即可得到可執行檔案(其中-g選項是為了gdb除錯所用),其中的庫為動態載入後又關閉的。我們使用gdb看一下程式碼:

(gdb) b main
Breakpoint 1 at 0x804878d: file progdl.c, line 12.
(gdb) r
Starting program: /home/gnuhpc/MyCode/lib/dynamic/progdl

Breakpoint 1, main (argc=1, argv=0xbffff4a4) at progdl.c:12
12 lib_handle = dlopen("/usr/local/lib/libctest.so", RTLD_LAZY);
(gdb) f
#0 main (argc=1, argv=0xbffff4a4) at progdl.c:12
12 lib_handle = dlopen("/usr/local/lib/libctest.so", RTLD_LAZY);
(gdb) s
13 if (!lib_handle)
(gdb) n
19 fn = dlsym(lib_handle, "ctest1");
(gdb)
20 if ((error = dlerror()) != NULL)
(gdb)
26 (*fn)(&x);
(gdb)
27 printf("Valx=%dn",x);
(gdb) p x
$1 = 5
(gdb) p fn
$2 = (double (*)(int *)) 0x28c4dc

可以看到fn獲得了ctest1的地址。

參考文獻:

本文來自CSDN部落格,轉載請標明出處:http://blog.csdn.net/gnuhpc/archive/2010/12/20/6086143.aspx

[@more@]

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/24790158/viewspace-1043515/,如需轉載,請註明出處,否則將追究法律責任。

相關文章