LDS檔案格式分析

奔跑的路發表於2015-11-02

連線指令碼是文字檔案.

你寫了一系列的命令作為一個連線指令碼. 每一個命令是一個帶有引數的關鍵字,或者是一個對符號的賦值. 你可
以用分號分隔命令. 空格一般被忽略.

檔名或格式名之類的字串一般可以被直接鍵入. 如果檔名含有特殊字元,比如一般作為分隔檔名用的逗
號, 你可以把檔名放到雙引號中. 檔名中間無法使用雙引號.

你可以象在C語言中一樣,在連線指令碼中使用註釋, 用'/*'和'*/'隔開. 就像在C中,註釋在語法上等同於空格.

簡單的連線指令碼示例
============================

許多指令碼是相當的簡單的.

可能的最簡單的指令碼只含有一個命令: 'SECTIONS'. 你可以使用'SECTIONS'來描述輸出檔案的記憶體佈局.

'SECTIONS'是一個功能很強大的命令. 這裡這們會描述一個很簡單的使用. 讓我們假設你的程式只有程式碼節,
初始化過的資料節, 和未初始化過的資料節. 這些會存在於'.text','.data'和'.bss'節, 另外, 讓我們進一
步假設在你的輸入檔案中只有這些節.

對於這個例子, 我們說程式碼應當被載入到地址'0x10000'處, 而資料應當從0x8000000處開始. 下面是一個實現
這個功能的指令碼:

    SECTIONS
    {
      . = 0x10000;
      .text : { *(.text) }
      . = 0x8000000;
      .data : { *(.data) }
      .bss : { *(.bss) }
    }

你使用關鍵字'SECTIONS'寫了這個SECTIONS命令, 後面跟有一串放在花括號中的符號賦值和輸出節描述的內容.

上例中, 在'SECTIONS'命令中的第一行是對一個特殊的符號'.'賦值, 這是一個定位計數器. 如果你沒有以其
它的方式指定輸出節的地址(其他方式在後面會描述), 那地址值就會被設為定位計數器的現有值. 定位計數器
然後被加上輸出節的尺寸. 在'SECTIONS'命令的開始處, 定位計數器擁有值'0'.

第二行定義一個輸出節,'.text'. 冒號是語法需要,現在可以被忽略. 節名後面的花括號中,你列出所有應當被
放入到這個輸出節中的輸入節的名字. '*'是一個萬用字元,匹配任何檔名. 表示式'*(.text)'意思是所有的輸
入檔案中的'.text'輸入節.

因為當輸出節'.text'定義的時候, 定位計數器的值是'0x10000',聯結器會把輸出檔案中的'.text'節的地址設
為'0x10000'.

餘下的內容定義了輸出檔案中的'.data'節和'.bss'節. 聯結器會把'.data'輸出節放到地址'0x8000000'處. 連線
器放好'.data'輸出節之後, 定位計數器的值是'0x8000000'加上'.data'輸出節的長度. 得到的結果是聯結器會
把'.bss'輸出節放到緊接'.data'節後面的位置.

聯結器會通過在必要時增加定位計數器的值來保證每一個輸出節具有它所需的對齊. 在這個例子中, 為'.text'
和'.data'節指定的地址會滿足對齊約束, 但是聯結器可能會需要在'.data'和'.bss'節之間建立一個小的缺口.

就這樣,這是一個簡單但完整的連線指令碼.

簡單的連線指令碼命令.
=============================

在本章中,我們會描述一些簡單的指令碼命令.

設定入口點.
-----------------------

在執行一個程式時第一個被執行到的指令稱為"入口點". 你可以使用'ENTRY'連線指令碼命令來設定入口點.引數
是一個符號名:
    ENTRY(SYMBOL)

有多種不同的方法來設定入口點.聯結器會通過按順序嘗試以下的方法來設定入口點, 如果成功了,就會停止.

  * `-e'入口命令列選項;

  * 連線指令碼中的`ENTRY(SYMBOL)'命令;

  * 如果定義了start, 就使用start的值;

  * 如果存在,就使用'.text'節的首地址;

  * 地址`0'.

處理檔案的命令.
---------------------------

有幾個處理檔案的連線指令碼命令.

`INCLUDE FILENAME'
在當前點包含連線指令碼檔案FILENAME. 在當前路徑下或用'-L'選項指定的所有路徑下搜尋這個檔案,
你可以巢狀使用'INCLUDE'達10層.

`INPUT(FILE, FILE, ...)'
`INPUT(FILE FILE ...)'
'INPUT'命令指示聯結器在連線時包含檔案, 就像它們是在命令列上指定的一樣.

比如,如果你在連線的時候總是要包含檔案'subr.o',但是你對每次連線時要在命令列上輸入感到厭煩
, 你就可以在你的連線指令碼中輸入'INPUT (subr.o).

事實上,如果你喜歡,你可以把你所有的輸入檔案列在連線指令碼中, 然後在連線的時候什麼也不需要,
只要一個'-T'選項就夠了.

在一個'系統根字首'被配置的情況下, 一個檔名如果以'/'字元打頭, 並且指令碼也存放在系統根
字首的某個子目錄下, 檔名就會被在系統根字首下搜尋. 否則聯結器就會企圖開啟當前目錄下的文
件. 如果沒有發現, 聯結器會通過檔案庫搜尋路徑進行搜尋.

如果你使用了'INPUT (-lFILE)', 'ld'會把檔名轉換為'libFILE.a', 就象命令列引數'-l'一樣.

當你在一個隱式連線指令碼中使用'INPUT'命令的時候, 檔案就會在連線時連線指令碼檔案被包含的點上
被包含進來. 這會影響到檔案搜尋.

`GROUP(FILE, FILE, ...)'
`GROUP(FILE FILE ...)'
除了檔案必須全是檔案檔案之外, 'GROUP'命令跟'INPUT'相似, 它們會被反覆搜尋,直至沒有未定義
的引用被建立.

`OUTPUT(FILENAME)'
'OUTPUT'命令命名輸出檔案. 在連線指令碼中使用'OUTPUT(FILENAME)'命令跟在命令列中使用'-o 
FILENAME'命令是完全等效的. 如果兩個都使用了, 那命令列選項優先.

你可以使用'OUTPUT'命令為輸出檔案建立一個預設的檔名,而不是常用的'a.out'.

`SEARCH_DIR(PATH)'
`SEARCH_DIR'命令給'ld'用於搜尋檔案檔案的路徑中再增加新的路徑. 使用`SEARCH_DIR(PATH)'跟在
命令列上使用'-L PATH'選項是完全等效的. 如果兩個都使用了, 那聯結器會兩個路徑都搜尋. 用命
令行選項指定的路徑首先被搜尋.

`STARTUP(FILENAME)'
除了FILENAME會成為第一個被連線的輸入檔案, 'STARTUP'命令跟'INPUT'命令完全相似, 就象這個文
件是在命令列上第一個被指定的檔案一樣. 如果在一個系統中, 入口點總是存在於第一個檔案中,那
這個就很有用.

處理目標檔案格式的命令.
-----------------------------------------

有兩個處理目標檔案格式的連線指令碼命令.

`OUTPUT_formAT(BFDNAME)'
`OUTPUT_formAT(DEFAULT, BIG, LITTLE)'
`OUTPUT_formAT'命令為輸出檔案使用的BFD格式命名. 使用`OUTPUT_formAT(BFDNAME)'跟在命令列上
使用'-oformat BFDNAME'是完全等效的. 如果兩個都使用了, 命令列選項優先.

你可在使用`OUTPUT_formAT'時帶有三個引數以使用不同的基於'-EB'和'-EL'的命令列選項的格式.

如果'-EB'和'-EL'都沒有使用, 那輸出格式會是第一個引數DEFAULT, 如果使用了'-EB',輸出格式會是
第二個引數BIG, 如果使用了'-EL', 輸出格式會是第三個引數, LITTLE.

比如, 預設的基於MIPS ELF平臺連線指令碼使用如下命令:

        OUTPUT_formAT(elf32-bigmips, elf32-bigmips, elf32-littlemips)
    這表示預設的輸出檔案格式是'elf32-bigmips', 但是當使用者使用'-EL'命令列選項的時候, 輸出檔案就會
    被以`elf32-littlemips'格式建立.

`TARGET(BFDNAME)'
'TARGET'命令在讀取輸入檔案時命名BFD格式. 它會影響到後來的'INPUT'和'GROUP'命令. 這個命令跟
在命令列上使用`-b BFDNAME'相似. 如果使用了'TARGET'命令但`OUTPUT_formAT'沒有指定, 最後的
'TARGET'命令也被用來設定輸出檔案的格式.

其它的連線指令碼命令.
----------------------------

還有一些其它的連線指令碼命令.

`ASSERT(EXP, MESSAGE)'
確保EXP不等於零,如果等於零, 聯結器就會返回一個錯誤碼退出,並列印出MESSAGE.

`EXTERN(SYMBOL SYMBOL ...)'
強制SYMBOL作為一個無定義的符號輸入到輸出檔案中去. 這樣做了,可能會引發從標準庫中連線一些
節外的庫. 你可以為每一個EXTERN'列出幾個符號, 而且你可以多次使用'EXTERN'. 這個命令跟'-u'
命令列選項具有相同的效果.

`FORCE_COMMON_ALLOCATION'
這個命令跟命令列選項'-d'具有相同的效果: 就算指定了一個可重定位的輸出檔案('-r'),也讓'ld'
為普通符號分配空間.

`INHIBIT_COMMON_ALLOCATION'
這個命令跟命令列選項`--no-define-common'具有相同的效果: 就算是一個不可重位輸出檔案, 也讓
'ld'忽略為普通符號分配的空間.

`NOCROSSREFS(SECTION SECTION ...)'
這個命令在遇到在某些特定的節之間引用的時候會產生一條錯誤資訊.

在某些特定的程式中, 特別是在使用覆蓋技術的嵌入式系統中, 當一個節被載入記憶體時,另外一個節
就不會在記憶體中. 任何在兩個節之間的直接引用都會是一個錯誤. 比如, 如果節1中的程式碼呼叫了另
一個節中的一個函式,這就會產生一個錯誤.

`NOCROSSREFS'命令帶有一個輸出節名字的列表. 如果'ld'遇到任何在這些節之間的交叉引用, 它就
會報告一個錯誤,並返回一個非零退出碼. 注意, `NOCROSSREFS'命令使用輸出節名,而不是輸入節名.

`OUTPUT_ARCH(BFDARCH)'
指定一個特定的輸出機器架構. 這個引數是BFD庫中使用的一個名字. 你可以通過使用帶有'-f'選項
的'objdump'程式來檢視一個目標檔案的架構.

為符號賦值.
===========================

你可以在一個連線指令碼中為一個符號賦一個值. 這會把一個符號定義為一個全域性符號.

簡單的賦值.
------------------

你可以使用所有的C賦值符號為一個符號賦值.

`SYMBOL = EXPRESSION ;'
`SYMBOL += EXPRESSION ;'
`SYMBOL -= EXPRESSION ;'
`SYMBOL *= EXPRESSION ;'
`SYMBOL /= EXPRESSION ;'
`SYMBOL <<= EXPRESSION ;'
`SYMBOL >>= EXPRESSION ;'
`SYMBOL &= EXPRESSION ;'
`SYMBOL |= EXPRESSION ;'

第一個情況會把SYMBOL定義為值EXPRESSION. 其它情況下, SYMBOL必須是已經定義了的, 而值會作出相應的調
整.

特殊符號名'.'表示定位計數器. 你只可以在'SECTIONS'命令中使用它.

EXPRESSION後面的分號是必須的.

表示式下面會定義.

你在寫表示式賦值的時候,可以把它們作為單獨的部分,也可以作為'SECTIONS'命令中的一個語句,或者作為
'SECTIONS'命令中輸出節描述的一個部分.

符號所在的節會被設定成表示式所在的節.

下面是一個關於在三處地方使用符號賦值的例子:

    floating_point = 0;
    SECTIONS
    {
      .text :
        {
          *(.text)
          _etext = .;
        }
      _bdata = (. + 3) & ~ 3;
      .data : { *(.data) }
    }

在這個例子中, 符號`floating_point'被定義為零. 符號'-etext'會被定義為前面一個'.text'節尾部的地址.
而符號'_bdata'會被定義為'.text'輸出節後面的一個向上對齊到4位元組邊界的一個地址值.

PROVIDE
-------

在某些情況下, 一個符號被引用到的時候只在連線指令碼中定義,而不在任何一個被連線進來的目標檔案中定
義. 這種做法是比較明智的. 比如, 傳統的聯結器定義了一個符號'etext'. 但是, ANSI C需要使用者能夠把
'etext'作為一個函式使用而不會產生錯誤. 'PROVIDE'關鍵字可以被用來定義一個符號, 比如'etext', 這個
定義只在它被引用到的時候有效,而在它被定義的時候無效.語法是 `PROVIDE(SYMBOL = EXPRESSION)'.

下面是一個關於使用'PROVIDE'定義'etext'的例子:

    SECTIONS
    {
      .text :
        {
          *(.text)
          _etext = .;
          PROVIDE(etext = .);
        }
    }

在這個例子中, 如果程式定義了一個'_etext'(帶有一個前導下劃線), 聯結器會給出一個重定義錯誤. 如果,
程式定義了一個'etext'(不帶前導下劃線), 聯結器會預設使用程式中的定義. 如果程式引用了'etext'但不
定義它, 聯結器會使用連線指令碼中的定義.

SECTIONS命令
================

'SECTIONS'命令告訴聯結器如何把輸入節對映到輸出節, 並如何把輸出節放入到記憶體中.

'SECTIONS'命令的格式如下:

    SECTIONS
    {
      SECTIONS-COMMAND
      SECTIONS-COMMAND
      ...
    }

每一個SECTIONS-COMMAND可能是如下的一種:

  * 一個'ENTRY'命令.

  * 一個符號賦值.

  * 一個輸出節描述.

  * 一個重疊描述.

'ENTRY'命令和符號賦值在'SECTIONS'命令中是允許的, 這是為了方便在這些命令中使用定位計數器. 這也可
以讓連線指令碼更容易理解, 因為你可以在更有意義的地方使用這些命令來控制輸出檔案的佈局.

輸出節描述和重疊描述在下面描述.

如果你在連線指令碼中不使用'SECTIONS'命令, 聯結器會按在輸入檔案中遇到的節的順序把每一個輸入節放到同
名的輸出節中. 如果所有的輸入節都在第一個檔案中存在,那輸出檔案中的節的順序會匹配第一個輸入檔案中
的節的順序. 第一個節會在地址零處.

輸出節描述
--------------------------

一個完整的輸出節的描述應該是這個樣子的:

    SECTION [ADDRESS] [(TYPE)] : [AT(LMA)]
      {
        OUTPUT-SECTION-COMMAND
        OUTPUT-SECTION-COMMAND
        ...
      } [>REGION] [AT>LMA_REGION] [:PHDR :PHDR ...] [=FILLEXP]

大多數輸出節不使用這裡的可選節屬性.

SECTION邊上的空格是必須的, 所以節名是明確的. 冒號跟花括號也是必須的. 斷行和其他的空格是可選的.

每一個OUTPUT-SECTION-COMMAND可能是如下的情況:

  * 一個符號賦值.

  * 一個輸入節描述.

  * 直接包含的資料值.

  * 一個特定的輸出節關鍵字.
  
輸出節名.
-------------------

輸出節的名字是SECTION. SECTION必須滿足你的輸出格式的約束. 在一個只支援限制數量的節的格式中,比如
'a.out',這個名字必須是格式支援的節名中的一個(比如, 'a.out'只允許'.text', '.data'或'.bss').如果
輸出格式支援任意數量的節, 但是隻支援數字,而沒有名字(就像Oasys中的情況), 名字應當以一個雙引號中的
數值串的形式提供.一個節名可以由任意數量的字元組成,但是一個含有任意非常用字元(比如逗號)的字句必須
用雙引號引起來.

輸出節描述
--------------------------

ADDRESS是關於輸出節中VMS的一個表示式. 如果你不提供ADDRESS, 聯結器會基於REGION(如果存在)設定它,或
者基於定位計數器的當前值.

如果你提供了ADDRESS, 那輸出節的地址會被精確地設為這個值. 如果你既不提供ADDRESS也不提供REGION, 那
輸出節的地址會被設為當前的定位計數器向上對齊到輸出節需要的對齊邊界的值. 輸出節的對齊要求是所有輸
入節中含有的對齊要求中最嚴格的一個.

比如:
    .text . : { *(.text) }


    .text : { *(.text) }

有細微的不同. 第一個會把'.text'輸出節的地址設為當前定位計數器的值. 第二個會把它設為定位計數器的
當前值向上對齊到'.text'輸入節中對齊要求最嚴格的一個邊界.

ADDRESS可以是任意表示式; 比如,如果你需要把節對齊對0x10位元組邊界,這樣就可以讓低四位元組的節地址值為
零, 你可以這樣做:

    .text ALIGN(0x10) : { *(.text) }

這個語句可以正常工作,因為'ALIGN'返回當前的定位計數器,並向上對齊到指定的值.

指定一個節的地址會改變定位計數器的值.

輸入節描述
-------------------------

最常用的輸出節命令是輸入節描述.

輸入節描述是最基本的連線指令碼操作. 你使用輸出節來告訴聯結器在記憶體中如何佈局你的程式. 你使用輸入節
來告訴聯結器如何把輸入檔案對映到你的記憶體中.

輸入節基礎
---------------------------

一個輸入節描述由一個檔名後跟有可選的括號中的節名列表組成.

檔名和節名可以萬用字元形式出現, 這個我們以後再介紹.

最常用的輸入節描述是包含在輸出節中的所有具有特定名字的輸入節. 比如, 包含所有輸入'.text'節,你可以
這樣寫:

    *(.text)

這裡,'*'是一個萬用字元,匹配所有的檔名. 為把一部分檔案排除在匹配的名字萬用字元之外, EXCLUDE_FILE可
以用來匹配所有的除了在EXCLUDE_FILE列表中指定的檔案.比如:

    (*(EXCLUDE_FILE (*crtend.o *otherfile.o) .ctors))

會讓除了`crtend.o'檔案和`otherfile.o'檔案之外的所有的檔案中的所有的.ctors節被包含進來.

有兩種方法包含多於一個的節:

    *(.text .rdata)
    *(.text) *(.rdata)

上面兩句的區別在於'.text'和'.rdata'輸入節的輸出節中出現的順序不同. 在第一個例子中, 兩種節會交替
出現,並以聯結器的輸入順序排布. 在第二個例子中,所有的'.text'輸入節會先出現,然後是所有的'.rdata'節.

你可以指定檔名,以從一個特定的檔案中包含節. 如果一個或多個你的檔案含有特殊的資料在記憶體中需要特
殊的定位,你可以這樣做. 比如:

    data.o(.data)

如果你使用一個不帶有節列表的檔名, 那輸入檔案中的所有的節會被包含到輸出節中. 通常不會這樣做, 但
是在某些場合下這個可能非常有用. 比如:

    data.o
    
當你使用一個不含有任何萬用字元的檔名時, 聯結器首先會檢視你是否在連線命令列上指定了檔名或者在
'INPUT'命令中. 如果你沒有, 聯結器會試圖把這個檔案作為一個輸入檔案開啟, 就像它在命令列上出現一樣.
注意這跟'INPUT'命令不一樣, 因為聯結器會在檔案搜尋路徑中搜尋檔案.

輸入節萬用字元
---------------------------------

在一個輸入節描述中, 檔名或者節名,或者兩者同時都可以是萬用字元形式.

檔名萬用字元'*'在很多例子中都可以看到,這是一個簡單的檔名萬用字元形式.

萬用字元形式跟Unix Shell中使用的一樣.

`*'
匹配任意數量的字元.

`?'
匹配單個字元.

`[CHARS]'
匹配CHARS中的任意單個字元; 字元'-'可以被用來指定字元的方訌, 比如[a-z]匹配任意小字字元.

`\'
轉義其後的字元.

當一個檔名跟一個萬用字元匹配時, 萬用字元字元不會匹配一個'/'字元(在UNIX系統中用來分隔目錄名), 一個
含有單個'*'字元的形式是個例外; 它總是匹配任意檔名, 不管它是否含有'/'. 在一個節名中, 萬用字元字
符會匹配'/'字元.

檔名萬用字元只匹配那些在命令列或在'INPUT'命令上顯式指定的檔案. 聯結器不會通過搜尋目錄來展開通配
符.

如果一個檔名匹配多於一個萬用字元, 或者如果一個檔名顯式出現同時又匹配了一個萬用字元, 聯結器會使用
第一次匹配到的連線指令碼. 比如, 下面的輸入節描述序列很可能就是錯誤的,因為'data.o'規則沒有被使用:

    .data : { *(.data) }
    .data1 : { data.o(.data) }

通常, 聯結器會把匹配萬用字元的檔案和節按在連線中被看到的順序放置. 你可以通過'SORT'關鍵字改變它, 它
出現在括號中的萬用字元之前(比如, 'SORT(.text*)'). 當'SORT'關鍵字被使用時, 聯結器會在把檔案和節放到
輸出檔案中之前按名字順序重新排列它們.

如果你對於輸入節被放置到哪裡去了感到很困惑, 那可以使用'-M'連線選項來產生一個點陣圖檔案. 點陣圖檔案會
精確顯示輸入節是如何被對映到輸出節中的.

這個例子顯示了萬用字元是如何被用來區分檔案的. 這個連線指令碼指示聯結器把所有的'.text'節放到'.text'中, 把所有的'.bss'節放到'.bss'. 聯結器會把所有的來自檔名以一個大寫字母開始的檔案中的'.data'節放進'.DATA'節中; 對於所有其他檔案, 聯結器會把'.data'節放進'.data'節中.

    SECTIONS {
      .text : { *(.text) }
      .DATA : { [A-Z]*(.data) }
      .data : { *(.data) }
      .bss : { *(.bss) }
    }

輸入節中的普通符號.
-----------------------------------

對於普通符號,需要一個特殊的標識, 因為在很多目標格式中, 普通符號沒有一個特定的輸入節. 聯結器會把
普通符號處理成好像它們在一個叫做'COMMON'的節中.

你可能像使用帶有其他輸入節的檔名一樣使用帶有'COMMON'節的檔名。你可以通過這個把來自一個特定輸
入檔案的普通符號放入一個節中,同時把來自其它輸入檔案的普通符號放入另一個節中。

在大多數情況下,輸入檔案中的普通符號會被放到輸出檔案的'.bss'節中。比如:

    .bss { *(.bss) *(COMMON) }

有些目標檔案格式具有多於一個的普通符號。比如,MIPS ELF目標檔案格式區分標準普通符號和小普通符號。
在這種情況下,聯結器會為其他型別的普通符號使用一個不同的特殊節名。 在MIPS ELF的情況中, 聯結器
為標準普通符號使用'COMMON',並且為小普通符號使用'.common'。這就允許你把不同型別的普通符號對映到
記憶體的不同位置。

在一些老的連線指令碼上,你有時會看到'[COMMON]'。這個符號現在已經過時了, 它等效於'*(COMMON)'。

輸入節和垃圾收集
---------------------------------------

當連線時垃圾收集正在使用中時('--gc-sections'),這在標識那些不應該被排除在外的節時非常有用。這
是通過在輸入節的萬用字元入口外面加上'KEEP()'實現的,比如'KEEP(*(.init))'或者'KEEP(SORT(*)(.sorts))
'。

輸入節示例
---------------------

接下來的例子是一個完整的連線指令碼。它告訴聯結器去讀取檔案'all.o'中的所有節,並把它們放到輸出節
'outputa'的開始位置處, 該輸出節是從位置'0x10000'處開始的。 從檔案'foo.o'中來的所有節'.input1'
在同一個輸出節中緊密排列。 從檔案'foo.o'中來的所有節'.input2'全部放入到輸出節'outputb'中,後面
跟上從'foo1.o'中來的節'.input1'。來自所有檔案的所有餘下的'.input1'和'.input2'節被寫入到輸出節
'outputc'中。

    SECTIONS {
      outputa 0x10000 :
        {
        all.o
        foo.o (.input1)
        }
      outputb :
        {
        foo.o (.input2)
        foo1.o (.input1)
        }
      outputc :
        {
        *(.input1)
        *(.input2)
        }
    }
    
輸出節資料
-------------------

你可以通過使用輸出節命令'BYTE','SHORT','LONG','QUAD',或者'SQUAD'在輸出節中顯式包含幾個位元組的資料
每一個關鍵字後面都跟上一個圓括號中的要存入的值。表示式的值被存在當前的定位計數器的值處。

‘BYTE’,‘SHORT’,‘LONG’‘QUAD’命令分別儲存一個,兩個,四個,八個位元組。存入位元組後,定位計
數器的值加上被存入的位元組數。

比如,下面的命令會存入一位元組的內容1,後面跟上四位元組,其內容是符號'addr'的值。

    BYTE(1)
    LONG(addr)

當使用64位系統時,‘QUAD’和‘SQUAD’是相同的;它們都會儲存8位元組,或者說是64位的值。而如果軟硬體
系統都是32位的,一個表示式就會被作為32位計算。在這種情況下,‘QUAD’儲存一個32位值,並把它零擴充套件
到64位, 而‘SQUAD’會把32位值符號擴充套件到64位。

如果輸出檔案的目標檔案格式有一個顯式的endianness,它在正常的情況下,值就會被以這種endianness儲存
當一個目標檔案格式沒有一個顯式的endianness時, 值就會被以第一個輸入目標檔案的endianness儲存。

注意, 這些命令只在一個節描述內部才有效,而不是在它們之間, 所以,下面的程式碼會使聯結器產生一個錯
誤資訊:

    SECTIONS { .text : { *(.text) } LONG(1) .data : { *(.data) } }

而這個才是有效的:

    SECTIONS { .text : { *(.text) ; LONG(1) } .data : { *(.data) } }

你可能使用‘FILL’命令來為當前節設定填充樣式。它後面跟有一個括號中的表示式。任何未指定的節內記憶體
區域(比如,因為輸入節的對齊要求而造成的裂縫)會以這個表示式的值進行填充。一個'FILL'語句會覆蓋到
它本身在節定義中出現的位置後面的所有記憶體區域;通過引入多個‘FILL’語句,你可以在輸出節的不同位置
擁有不同的填充樣式。

這個例子顯示如何在未被指定的記憶體區域填充'0x90':

    FILL(0x90909090)

‘FILL’命令跟輸出節的‘=FILLEXP’屬性相似,但它隻影響到節內跟在‘FILL’命令後面的部分,而不是
整個節。如果兩個都用到了,那‘FILL’命令優先。

輸出節關鍵字
-----------------------

有兩個關鍵字作為輸出節命令的形式出現。

`CREATE_OBJECT_SYMBOLS'
這個命令告訴聯結器為每一個輸入檔案建立一個符號。而符號的名字正好就是相關輸入檔案的名字。
而每一個符號的節就是`CREATE_OBJECT_SYMBOLS'命令出現的那個節。

這個命令一直是a.out目標檔案格式特有的。 它一般不為其它的目標檔案格式所使用。

`CONSTRUCTORS'
當使用a.out目標檔案格式進行連線的時候, 聯結器使用一組不常用的結構以支援C++的全域性構造函
數和解構函式。當連線不支援專有節的目標檔案格式時, 比如ECOFF和XCOFF,聯結器會自動辯識C++
全域性建構函式和解構函式的名字。對於這些目標檔案格式,‘CONSTRUCTORS’命令告訴聯結器把構造
函式資訊放到‘CONSTRUCTORS’命令出現的那個輸出節中。對於其它目標檔案格式,‘CONSTRUCTORS’
命令被忽略。

符號`__CTOR_LIST__'標識全域性建構函式的開始,而符號`__DTOR_LIST'標識結束。這個列表的第一個
WORD是入口的數量,緊跟在後面的是每一個建構函式和解構函式的地址,再然後是一個零WORD。編譯
器必須安排如何實際執行程式碼。對於這些目標檔案格式,GNU C++通常從一個`__main'子程式中呼叫
建構函式,而對`__main'的呼叫自動被插入到`main'的啟動程式碼中。GNU C++通常使用'atexit'執行
解構函式,或者直接從函式'exit'中執行。

對於像‘COFF’或‘ELF’這樣支援專有節名的目標檔案格式,GNU C++通常會把全域性建構函式與析構
函式的地址值放到'.ctors'和'.dtors'節中。把下面的程式碼序列放到你的連線指令碼中去,這樣會構建
出GNU C++執行時程式碼希望見到的表型別。

              __CTOR_LIST__ = .;
              LONG((__CTOR_END__ - __CTOR_LIST__) / 4 - 2)
              *(.ctors)
              LONG(0)
              __CTOR_END__ = .;
              __DTOR_LIST__ = .;
              LONG((__DTOR_END__ - __DTOR_LIST__) / 4 - 2)
              *(.dtors)
              LONG(0)
              __DTOR_END__ = .;

如果你正使用GNU C++支援來進行優先初始化,那它提供一些可以控制全域性建構函式執行順序的功能,
你必須在連線時給建構函式排好序以保證它們以正確的順序被執行。當使用'CONSTRUCTORS'命令時,
替代為`SORT(CONSTRUCTORS)'。當使用'.ctors'和'dtors'節時,使用`*(SORT(.ctors))'和
`*(SORT(.dtors))' 而不是`*(.ctors)'和`*(.dtors)'。

通常,編譯器和聯結器會自動處理這些事情,並且你不必親自關心這些事情。但是,當你正在使用
C++,並自己編寫連線指令碼時,你可能就要考慮這些事情了。

輸出節的丟棄。
-------------------------

聯結器不會建立那些不含有任何內容的輸出節。這是為了引用那些可能出現或不出現在任何輸入檔案中的輸入
節時方便。比如:

    .foo { *(.foo) }

如果至少在一個輸入檔案中有'.foo'節,它才會在輸出檔案中建立一個'.foo'節

如果你使用了其它的而不是一個輸入節描述作為一個輸出節命令,比如一個符號賦值,那這個輸出節總是被
建立,即使沒有匹配的輸入節也會被建立。

一個特殊的輸出節名`/DISCARD/'可以被用來丟棄輸入節。任何被分配到名為`/DISCARD/'的輸出節中的輸入
節不包含在輸出檔案中。

輸出節屬性
-------------------------

上面,我們已經展示了一個完整的輸出節描述,看下去就象這樣:

    SECTION [ADDRESS] [(TYPE)] : [AT(LMA)]
      {
        OUTPUT-SECTION-COMMAND
        OUTPUT-SECTION-COMMAND
        ...
      } [>REGION] [AT>LMA_REGION] [:PHDR :PHDR ...] [=FILLEXP]

我們已經介紹了SECTION, ADDRESS, 和OUTPUT-SECTION-COMMAND. 在這一節中,我們將介紹餘下的節屬性。

輸出節型別
...................

每一個輸出節可以有一個型別。型別是一個放在括號中的關鍵字,已定義的型別如下所示:

`NOLOAD'
這個節應當被標式詎不可載入,所以當程式執行時,它不會被載入到記憶體中。

`DSECT'
`COPY'
`INFO'
`OVERLAY'
支援這些型別名只是為了向下相容,它們很少使用。它們都具有相同的效果:這個節應當被標式詎不
可分配,所以當程式執行時,沒有記憶體為這個節分配。

聯結器通常基於對映到輸出節的輸入節來設定輸出節的屬性。你可以通過使用節型別來重設這個屬性,
比如,在下面的指令碼例子中,‘ROM’節被定址在記憶體地址零處,並且在程式執行時不需要被載入。
‘ROM’節的內容會正常出現在連線輸出檔案中。

    SECTIONS {
      ROM 0 (NOLOAD) : { ... }
      ...
    }

輸出節LMA
..................

每一個節有一個虛地址(VMA)和一個載入地址(LMA);出現在輸出節描述中的地址表示式設定VMS

聯結器通常把LMA跟VMA設成相等。你可以通過使用‘AT’關鍵字改變這個。跟在關鍵字‘AT’後面的表示式
LMA指定節的載入地址。或者,通過`AT>LMA_REGION'表示式, 你可以為節的載入地址指定一個記憶體區域。

這個特性是為了便於建立ROM映像而設計的。比如,下面的連線指令碼建立了三個輸出節:一個叫做‘.text’
從地址‘0x1000’處開始,一個叫‘.mdata’,儘管它的VMA是'0x2000',它會被載入到'.text'節的後面,最
後一個叫做‘.bss’是用來放置未初始化的資料的,其地址從'0x3000'處開始。符號'_data'被定義為值
'0x2000', 它表示定位計數器的值是VMA的值,而不是LMA。

    SECTIONS
      {
      .text 0x1000 : { *(.text) _etext = . ; }
      .mdata 0x2000 :
        AT ( ADDR (.text) + SIZEOF (.text) )
        { _data = . ; *(.data); _edata = . ;  }
      .bss 0x3000 :
        { _bstart = . ;  *(.bss) *(COMMON) ; _bend = . ;}
    }

這個連線指令碼產生的程式使用的執行時初始化程式碼會包含象下面所示的一些東西,以把初始化後的資料從ROM
映像中拷貝到它的執行時地址中去。注意這節程式碼是如何利用好連線指令碼定義的符號的。

    extern char _etext, _data, _edata, _bstart, _bend;
    char *src = &_etext;
    char *dst = &_data;
    
    /* ROM has data at end of text; copy it. */
    while (dst < &_edata) {
      *dst++ = *src++;
    }
    
    /* Zero bss */
    for (dst = &_bstart; dst< &_bend; dst++)
      *dst = 0;

輸出節區域
.....................

你可以通過使用`>REGION'把一個節賦給前面已經定義的一個記憶體區域。

這裡有一個簡單的例子:

    MEMORY { rom : ORIGIN = 0x1000, LENGTH = 0x1000 }
    SECTIONS { ROM : { *(.text) } >rom }

輸出節Phdr
...................

你可以通過使用`:PHDR'把一個節賦給前面已定義的一個程式段。如果一個節被賦給一個或多個段,那後來分
配的節都會被賦給這些段,除非它們顯式使用了':PHDR'修飾符。你可以使用':NONE'來告訴聯結器不要把節
放到任何一個段中。

這兒有一個簡單的例子:

    PHDRS { text PT_LOAD ; }
    SECTIONS { .text : { *(.text) } :text }

輸出段填充
...................

你可以通過使用'=FILLEXP'為整個節設定填充樣式。FILLEXP是一個表示式。任何沒有指定的輸出段內的記憶體
區域(比如,因為輸入段的對齊要求而產生的裂縫)會被填入這個值。如果填充表示式是一個簡單的十六進位制
值,比如,一個以'0x'開始的十六進位制數字組成的字串,並且尾部不是'k'或'M',那一個任意的十六進位制數
字長序列可以被用來指定填充樣式;前導零也變為樣式的一部分。對於所有其他的情況,包含一個附加的括號
或一元操作符'+',那填充樣式是表示式的最低四位元組的值。在所有的情況下,數值是big-endian.

你還可以通過在輸出節命令中使用'FILL'命令來改變填充值。

這裡是一個簡單的例子:
    SECTIONS { .text : { *(.text) } =0x90909090 }

覆蓋描述
-------------------

一個覆蓋描述提供一個簡單的描述辦法,以描述那些要被作為一個單獨記憶體映像的一部分載入記憶體,但是卻要
在同一記憶體地址執行的節。在執行時,一些覆蓋管理機制會把要被覆蓋的節按需要拷入或拷出執行時記憶體地址,
並且多半是通過簡單地處理記憶體位。 這個方法可能非常有用,比如在一個特定的記憶體區域比另一個快時。

覆蓋是通過‘OVERLAY’命令進行描述。‘OVERLAY’命令在‘SECTIONS’命令中使用,就像輸出段描述一樣。
‘OVERLAY’命令的完整語法如下:

    OVERLAY [START] : [NOCROSSREFS] [AT ( LDADDR )]
      {
        SECNAME1
          {
            OUTPUT-SECTION-COMMAND
            OUTPUT-SECTION-COMMAND
            ...
          } [:PHDR...] [=FILL]
        SECNAME2
          {
            OUTPUT-SECTION-COMMAND
            OUTPUT-SECTION-COMMAND
            ...
          } [:PHDR...] [=FILL]
        ...
      } [>REGION] [:PHDR...] [=FILL]

除了‘OVERLAY’關鍵字,所有的都是可選的,每一個節必須有一個名字(上面的SECNAME1和SECNAME2)。在
‘OVERLAY’結構中的節定義跟通常的‘SECTIONS’結構中的節定義是完全相同的,除了一點,就是在‘OVERLAY’
中沒有地址跟記憶體區域的定義。

節都被定義為同一個開始地址。所有節的載入地址都被排布,使它們在記憶體中從整個'OVERLAY'的載入地址開
始都是連續的(就像普通的節定義,載入地址是可選的,預設的就是開始地址;開始地址也是可選的,預設的
是當前的定位計數器的值。)

如果使用了關鍵字`NOCROSSREFS', 並且在節之間存在引用,聯結器就會報告一個錯誤。因為節都執行在同一
個地址上,所以一個節直接引用另一個節中的內容是錯誤的。

對於'OVERLAY'中的每一個節,聯結器自動定義兩個符號。符號`__load_start_SECNAME'被定義為節的開始載
入地址。符號`__load_stop_SECNAME'被定義為節的最後載入地址。SECNAME中的不符合C規定的任何字元都將
被刪除。C(或者組合語言)程式碼可能使用這些符號在必要的時間搬移覆蓋程式碼。

在覆蓋區域的最後,定位計數器的值被設為覆蓋區域的開始地址加上最大的節的長度。

這裡是一個例子。記住這隻會出現在‘SECTIONS’結構的內部。

      OVERLAY 0x1000 : AT (0x4000)
      {
        .text0 { o1/*.o(.text) }
        .text1 { o2/*.o(.text) }
      }

這段程式碼會定義'.text0'和'.text1',它們都從地址0x1000開始。‘.text0'會被載入到地址0x4000處,而
'.text1'會被載入到緊隨'.text0'後的位置。下面的幾個符號會被定義:`__load_start_text0', 
`__load_stop_text0', `__load_start_text1', `__load_stop_text1'.

拷貝'.text1'到覆蓋區域的C程式碼看上去可能會像下面這樣:

      extern char __load_start_text1, __load_stop_text1;
      memcpy ((char *) 0x1000, &__load_start_text1,
              &__load_stop_text1 - &__load_start_text1);

注意'OVERLAY'命令只是為了語法上的便利,因為它所做的所有事情都可以用更加基本的命令加以代替。上面
的例子可以用下面的完全特效的寫法:

      .text0 0x1000 : AT (0x4000) { o1/*.o(.text) }
      __load_start_text0 = LOADADDR (.text0);
      __load_stop_text0 = LOADADDR (.text0) + SIZEOF (.text0);
      .text1 0x1000 : AT (0x4000 + SIZEOF (.text0)) { o2/*.o(.text) }
      __load_start_text1 = LOADADDR (.text1);
      __load_stop_text1 = LOADADDR (.text1) + SIZEOF (.text1);
      . = 0x1000 + MAX (SIZEOF (.text0), SIZEOF (.text1));

 
 
  

============

聯結器在預設狀態下被配置為允許分配所有可用的記憶體塊。你可以使用‘MEMORY’命令重新配置這個設定。

‘MEMORY’命令描述目標平臺上記憶體塊的位置與長度。你可以用它來描述哪些記憶體區域可以被聯結器使用,
哪些記憶體區域是要避免使用的。然後你就可以把節分配到特定的記憶體區域中。聯結器會基於記憶體區域設定節
的地址,對於太滿的區域,會提示警告資訊。聯結器不會為了適應可用的區域而攪亂節。

一個連線指令碼最多可以包含一次'MEMORY'命令。但是,你可以在命令中隨心所欲定義任意多的記憶體塊,語法
如下:

    MEMORY
      {
        NAME [(ATTR)] : ORIGIN = ORIGIN, LENGTH = LEN
        ...
      }

NAME是用在連線指令碼中引用記憶體區域的名字。出了連線指令碼,區域名就沒有任何實際意義。區域名儲存在一個
單獨的名字空間中,它不會和符號名,檔名,節名產生衝突,每一塊記憶體區域必須有一個唯一的名字。

ATTR字串是一個可選的屬性列表,它指出是否為一個沒有在連線指令碼中進行顯式對映地輸入段使用一個特定
的記憶體區域。如果你沒有為某些輸入段指定一個輸出段,聯結器會建立一個跟輸入段同名的輸出段。如果你定
義了區域屬性,聯結器會使用它們來為它建立的輸出段選擇記憶體區域。

ATTR字串必須包含下面字元中的一個,且必須只包含一個:
`R'
只讀節。
`W'
    可讀寫節。
`X'
可執行節。
`A'
可分配節。
`I'
已初始化節。
`L'
    同‘I’
`!'
對前一個屬性值取反。

如果一個未對映節匹配了上面除'!'之外的一個屬性,它就會被放入該記憶體區域。'!'屬性對該測試取反,所以
只有當它不匹配上面列出的行何屬性時,一個未對映節才會被放入到記憶體區域。

ORIGIN是一個關於記憶體區域地始地址的表示式。在記憶體分配執行之前,這個表示式必須被求值產生一個常數,
這意味著你不可以使用任何節相關的符號。關鍵字'ORIGIN'可以被縮寫為'org'或'o'(但是,不可以寫為,比
如‘ORG’)

LEN是一個關於記憶體區域長充(以位元組為單位)的表示式。就像ORIGIN表示式,這個表示式在分配執行前也
必須被求得為一個常數值。關鍵字'LENGTH'可以被簡寫為‘len'或'l'。

在下面的例子中,我們指定兩個可用於分配的記憶體區域:一個從0開始,有256kb長度,另一個從0x4000000
開始,有4mb長度。聯結器會把那些沒有進行顯式對映且是隻讀或可執行的節放到'rom'記憶體區域。並會把另
外的沒有被顯式對映地節放入到'ram'記憶體區域。

    MEMORY
      {
        rom (rx)  : ORIGIN = 0, LENGTH = 256K
        ram (!rx) : org = 0x40000000, l = 4M
      }

一旦你定義了一個記憶體區域,你也可以指示聯結器把指定的輸出段放入到這個記憶體區域中,這可以通過使用
'>REGION'輸出段屬性。比如,如果你有一個名為'mem'的記憶體區域,你可以在輸出段定義中使用'>mem'。如
果沒有為輸出段指定地址,聯結器就會把地址設定為記憶體區域中的下一個可用的地址。如果總共的對映到一
個記憶體區域的輸出段對於區域來說太大了,聯結器會提示一條錯誤資訊。

PHDRS命令
=============

ELF目標檔案格式使用“程式頭”,它也就是人們熟知的“節”。程式頭描述了程式應當如何被載入到記憶體中。
你可以通過使用帶有'-p'選項的‘objdump’命令來列印出這個程式頭。

當你在一個純ELF系統上執行ELF程式時,系統的載入程式通過讀取檔案頭來計算得到如何來載入這個檔案。這
只在程式頭被正確設定的情況下才會正常工作。本手冊並不打算介紹系統載入程式如何解釋檔案頭的相關細節
問題;關於更多資訊,請參閱ELF ABI。

連線順在預設狀態下會自己建立一個可用的程式頭。但是,在某些情況下,你可能需要更為精確地指定程式頭。
你可以使用命令‘PHDRS’達到這個目的。當聯結器在連線指令碼中看到‘PHDRS’命令時,它只會建立被指定了
的程式頭。

聯結器只在產生ELF輸出檔案時關心‘PHDRS’命令。在其它情況下,聯結器只是簡單地忽略‘PHDRS’。

下面是‘PHDRS’命令的語法。單詞‘PHDRS’,‘FILEHDR’,‘AT’和‘FLAGS’都是關鍵字。

    PHDRS
    {
      NAME TYPE [ FILEHDR ] [ PHDRS ] [ AT ( ADDRESS ) ]
            [ FLAGS ( FLAGS ) ] ;
    }

NAME只在連線指令碼的‘SECTIONS’命令中引用時用到。它不會被放到輸出檔案中。程式頭的名字會被儲存到單獨
的名字空間中。每一個程式頭都必須有一個唯一的名字。

某些特定型別的程式頭描述系統載入程式要從檔案中載入到記憶體的節。在連線指令碼中,你通過把可載入的輸出節放
到段中來指定這些段的內容。你可以使用‘:PHDR’輸出節屬性把一個節放到一個特定的段中。

把某些節放到多個段中也是正常的。這僅僅暗示了一個記憶體段中含有另一個段。你可以重複使用‘:PHDR’,在每
一個應當含有這個節的段中使用它一次。

如果你使用‘:PHDR’把一個節放到多個段中,那聯結器把隨後的所有沒有指定‘:PHDR’的可分配節都放到同一個
段中。這是為了方便,因為通常一串連續的節會被放到一個單獨的段中。你可以使用‘:NONE’來覆蓋預設的段,
告訴聯結器不要把節放到任何一個段中。

你可能在程式頭型別後面使用‘FILEHDR’和‘PHDRS’關鍵字來進一步描述段的內容。‘FILEHDR’關鍵字表示段應
當包含ELF檔案頭。‘PHDRS’關鍵字表示段應當包含ELF程式頭本身。

TYPE可以是如下的一個。數字表示關鍵字的值。

`PT_NULL' (0)
表示一個不用的程式頭。

`PT_LOAD' (1)
表示這個程式頭描述了一個被從檔案中載入的段。

`PT_DYNAMIC' (2)
    表示一個可以從中找到動態連結資訊的段。

`PT_INTERP' (3)
  表示一個可以從中找到關於程式名解釋的段。

`PT_NOTE' (4)
表示一個存有備註資訊的段。

`PT_SHLIB' (5)
  一個保留的程式頭型別,被定義了,但沒有被ELF ABI指定。

`PT_PHDR' (6)
表示一個可以從中找到程式頭的段。

EXPRESSION
一個給出程式頭的數值型別的表示式。這可以在使用上面未定義的型別時使用。

你可以通過使用‘AT’表示式指定一個段應當被載入到記憶體中的一個特定的地址。這跟
在輸出節屬性中使用‘AT’命令是完全一樣的。程式頭中的‘AT’命令會覆蓋輸出節屬
性中的。

聯結器通常會基於組成段的節來設定段屬性。你可以通過使用‘FLAGS’關鍵字來顯式指
定段標誌。FLAGS的值必須是一個整型值。它被用來設定程式頭的‘p_flags'域。

這裡是一個關於‘PHDRS’的例子。它展示一個在純ELF系統上的一個標準的程式頭設定。

    PHDRS
    {
      headers PT_PHDR PHDRS ;
      interp PT_INTERP ;
      text PT_LOAD FILEHDR PHDRS ;
      data PT_LOAD ;
      dynamic PT_DYNAMIC ;
    }
    
    SECTIONS
    {
      . = SIZEOF_HEADERS;
      .interp : { *(.interp) } :text :interp
      .text : { *(.text) } :text
      .rodata : { *(.rodata) } /* defaults to :text */
      ...
      . = . + 0x1000; /* move to a new page in memory */
      .data : { *(.data) } :data
      .dynamic : { *(.dynamic) } :data :dynamic
      ...
    }

VERSION命令
===============

在使用ELF時,聯結器支援符號版本。符號版本只在使用共享庫時有用。動態聯結器在執行一個
可能跟一個更早版本的共享庫連結程式時,可以使用符號版本來選擇一個函式的特定版本。

你可以直接在主連線指令碼中包含一個版本指令碼,或者你可以以一個隱式連線指令碼的形式提供這個
版本指令碼。你也可以使用‘--version-script'聯結器選項。

‘VERSION’命令的語法很簡單:

    VERSION { version-script-commands }

版本指令碼命令的格式跟Sun在Solaris 2.5中的聯結器的格式是完全一樣的。版本指令碼定義一個版本
節點樹。你可以在版本指令碼中指定節點名和依賴關係。你可以指定哪些符號被繫結到哪些版本節點
上,你還可以把一組指定的符號限定到本地範圍,這樣在共享庫的外面它們就不是全域性可見的了。

最簡單的演示版本指令碼語言的方法是出示幾個小例子:

    VERS_1.1 {
    global:
    foo1;
    local:
    old*;
    original*;
    new*;
    };
    
    VERS_1.2 {
    foo2;
    } VERS_1.1;
    
    VERS_2.0 {
    bar1; bar2;
    } VERS_1.2;

這個示例版本指令碼定義了三個版本節點。第一個版本節點定義為‘VERS_1.1’它沒有其它的依賴。
指令碼把符號‘foo1’繫結給‘VERS_1.1’。它把一些數量的符號限定到本地範圍,這樣它們在共
享庫的外面就不可見了;這是通過萬用字元來完成的,所以任何名字以‘old’,‘original’或
‘new’開頭的符號都會被匹配。可用的萬用字元跟在shell中匹配檔名時一樣。

下面,版本指令碼定義一個節點‘VER_1.2’。這個節點依賴‘VER_1.1’。指令碼把符號‘foo2’綁
定給節點‘VERS_1.2’。

最後,版本指令碼定義節點‘VERS_2.0’。這個節點依賴‘VERS_1.2’。指令碼把符號‘bar1’和
‘bar2 ’繫結給版本節點‘VERS_2.0’。

當聯結器發現一個定義在庫中的符號沒有被指定繫結到一個版本節點,它會把它繫結到一個未指
定基礎版本的庫。你可以通過使用‘global: *;’把所有未指定的符號繫結到一個給定的版本節
點上。

版本節點的名字沒有任何特殊的含義只是為了方便人們閱讀。版本‘2.0’可以出現在‘1.1’和
‘1.2’之間。但是,在書寫版本指令碼時,這會是一個引起混亂的辦法。

如果在版本指令碼中,這是一個唯一的版本節點,節點名可以被省略。這樣的版本指令碼不給符號賦
任何版本,只是選擇哪些符號會被全域性可見而哪些不會。

    { global: foo; bar; local: *; };

當你把一個程式跟一個帶有版本符號的共享庫連線時,程式自身知道每個符號的哪個版本是它需
要的,而且它還知道它連線的每一個節享庫中哪些版本的節點是它需要的。這樣,在執行時,動
態載入程式可以做一個快速的確認,以保證你連線的庫確實提供了所有的程式需要用來解析所有
動態符號的版本節點。用這種方法,就有可能讓每一個動態聯結器知道所有的外部符號不需要通
過搜尋每一個符號引用就能解析。

符號版本在SunOS上做次版本確認是一種很成熟的方法。一個被提出來的基本的問題是對於外部
函式的標準引用會在需要時被繫結到正確的版本,但不是在程式啟動的時候全部被繫結。如果一
個共享庫過期了,一個需要的介面可能就不存在了;當程式需要使用這個介面的時候,它可能會
突然地意外失敗。有了符號版本後,當使用者啟動他們的程式時,如果要使用的共享庫太老了的話,
使用者會得到一條警告資訊。

GNU對Sun的版本確認辦法有一些擴充套件。首先就是能在符號定義的原始檔中把一個符號繫結到一個
版本節點而不是在一個版本指令碼中。這主要是為了減輕庫維護的工作量。你可以通過類似下面的
程式碼實現這一點:

    __asm__(".symver original_foo,foo@VERS_1.1");

在C原始檔中。這句會給函式'original_foo'取一個別名'foo',並繫結到版本節點`VERS_1.1'。
操作符'local:'可以被用來阻止符號'original_foo'被匯出。操作符'.symver'使這句優先於版
本指令碼。

第二個GNU的擴充套件是在一個給定的共享庫中允許同一個函式的多個版本。通過這種辦法,你可以
不增加共享庫的主版本號而對介面做完全不相容的修改。

要實現這個,你必須在一個原始檔中多次使用'.symver'操作符。這裡是一個例子:

    __asm__(".symver original_foo,foo@");
    __asm__(".symver old_foo,foo@VERS_1.1");
    __asm__(".symver old_foo1,foo@VERS_1.2");
    __asm__(".symver new_foo,foo@@VERS_2.0");

在這個例子中,'foo@'表示把符號'foo'繫結到一個沒有指基版本的符號上。含有這個例子的源
檔案必須定義4個C函式:`original_foo', `old_foo', `old_foo1', 和`new_foo'.

當你有一個給定符號的多個定義後,有必要有一個方法可以指定一個預設的版本,對於這個符號
的外部引用就可以找到這個版本。用這種方法,你可以只宣告一個符號的一個版本作為預設版本,
否則,你會擁有同一個符號的多個定義。

如果你想要繫結一個引用到共享庫中的符號的一個指定的版本,你可以很方便地使用別名(比如,
old_foo),或者你可以使用'.symver'操作符來指定繫結到一個外部函式的特定版本。

你也可以在版本指令碼中指定語言。

    VERSION extern "lang" { version-script-commands }

被支援的'lang'有‘C’,‘C++’和‘Java’。

連線指令碼中的表示式
=============================

連線指令碼語言中的表示式的語法跟C的表示式是完全是致的。所有的表示式都以整型值被求值。所有
的表示式也被以相同的寬度求值。在32位系統是它是32位,否則是64位。
    
你可以在表示式中使用和設定符號值。

聯結器為了使用表示式,定義了幾個具有特殊途的內建函式。

常數
---------

所有的常數都是整型值。

就像在C中,聯結器把以'0'開頭的整型數視為八進位制數,把以'0x'或'0X'開頭的視為十六進位制。聯結器
把其它的整型數視為十進位制。

另外,你可以使用'K'和'M'字尾作為常數的度量單位,分別為'1024'和'1024*1024'。比如,下面的三個
常數表示同一個值。

    _fourk_1 = 4K;
    _fourk_2 = 4096;
    _fourk_3 = 0x1000;

符號名
------------

除了引用,符號名都是以一個字母,下劃線或者句號開始,可以包含字母,數字,下劃線,句點和連線號。
不是被引用的符號名必須不和任何關鍵字衝突。你可以指定一個含有不固定它符數或具有跟關鍵字相同名
字但符號名必須在雙引號內:

    "SECTION" = 9;
    "with a space" = "also with a space" + 10;

因為符號可以含有很多非文字字元,所以以空格分隔符號是很安全的。比如,'A-B'是一個符號,而'A - B'
是一個執行減法運算的表示式。

定位計數器
--------------------

一個特殊的聯結器變數"dot"'.'總是含有當前的輸出定位計數器。因為'.'總引用輸出段中的一個位置,它
只可以出現在'SECTIONS'命令中的表示式中。'.'符號可以出現在表示式中一個普能符號允許出現的任何位
置。

把一個值賦給'.'會讓定位計數器產生移動。這會在輸出段中產生空洞。定位計數器從不向前移動。

    SECTIONS
    {
      output :
        {
          file1(.text)
          . = . + 1000;
          file2(.text)
          . += 1000;
          file3(.text)
        } = 0x12345678;
    }

在前面的例子中,來自'file1'的'.text'節被定位在輸出節'output'的起始位置。它後面跟有1000byte的
空隙。然後是來自'file2'的'.text'節,同樣是後面跟有1000byte的空隙,最後是來自'file3'的'.text'
節。符號'=0x12345678'指定在空隙中填入什麼樣的資料。

注意:'.'實際上引用的是當前包含目標的從開始處的位元組偏移。通常,它就是'SECTIONS'語句,其起始地
址是0,因為'.'可以被用作絕對地址。但是如果'.'被用在一個節描述中,它引用的是從這個節起始處開始
的偏移,而不是一個絕對地址。這樣,在下面這樣一個指令碼中:

    SECTIONS
    {
        . = 0x100
        .text: {
          *(.text)
          . = 0x200
        }
        . = 0x500
        .data: {
          *(.data)
          . += 0x600
        }
    }

'.text'節被賦於起始地址0x100,儘管在'.text'輸入節中沒有足夠的資料來填充這個區域,但其長
度還是0x200bytes。(如果資料太多,那會產生一條錯誤資訊,因為這會試圖把'.'向前移)。'.data'
節會從0x500處開始,並且它在結尾處還會有0x600的額外空間。

運算子
---------

聯結器可以識別標準的C的算術運算子集, 以及它們的優先集.

    優先集        結合性          運算子                  備註
    (highest)
    1              left            !  -  ~                  (1)
    2              left            *  /  %
    3              left            +  -
    4              left            >>  <<
    5              left            ==  !=  >  <  <=  >=
    6              left            &
    7              left            |
    8              left            &&
    9              left            ||
    10              right          ? :
    11              right          &=  +=  -=  *=  /=      (2)
    (lowest)
  注: (1) 字首運算子 (2) *Note Assignments::.

求值
----------

聯結器是懶惰求表示式的值。它只在確實需要的時候去求一個表示式的值。

聯結器需要一些資訊,比如第一個節的起始地址的值,還有記憶體區域的起點與長度,在做任何連線的
時候這都需要。在聯結器讀取連線指令碼的時候,這些值在可能的時候被計算出來。

但是,其它的值(比如符號的值)直到記憶體被分配之後才會知道或需要。這樣的值直到其它資訊(比
如輸出節的長度)可以被用來進行符號賦值的時候才被計算出來。

直到記憶體分配之後,節的長度才會被知道,所以依賴於節長度的賦值只能到記憶體分配之後才會被執行。

有些表示式,比如那些依賴於定位計數器'.'的表示式,必須在節分配的過程中被計算出來。

如果一個表示式的結果現在被需要,但是目前得不到這個值,這樣會導致一個錯誤。比如,象下面這
樣一個指令碼:

    SECTIONS
      {
        .text 9+this_isnt_constant :
          { *(.text) }
      }

會產生一個錯誤資訊'non constant expression for initial address'.

表示式的節
----------------------------

當一個聯結器計算一個表示式時,得到的結果可能是一個絕對值,也可能跟某個節相關。一個節相關的
表示式是從一個節的基地址開始的固定的偏稱值。

表示式在連線指令碼中的位置決定了它是絕對的或節相關的。一個出現在輸出節定義中的表示式是跟輸出
節的基地址相關的。一個出現在其它地方的表示式則是絕對的。

如果你通過'-r'選項指定需要可重位輸出,那一個被賦為節相關的表示式的符號就會是可重定位的。意
思是下一步的連線操作會改變這個符號的值。符號的節就是節相關的表示式所在的節。

一個被賦為絕對錶達式的符號在後面進一步的連線操作中會始終保持它的值不變。符號會是絕對的,並
不會有任何的特定的相關節。

如果一個表示式有可能會是節相關的,你可以使用內建函式'ABSOLUTE'強制一個表示式為絕對的。比如,
要建立一個被賦為輸出節'.data'的末尾地址的絕對符號:

    SECTIONS
      {
        .data : { *(.data) _edata = ABSOLUTE(.); }
      }

如果沒有使用'ABSOLUTE','_edata'會跟節'.data'相關。

內建函式
-----------------

為了使用連線指令碼表示式,連線指令碼語言含有一些內建函式。

`ABSOLUTE(EXP)'
返回表示式EXP的絕對值(不可重定位,而不是非負)。主要在把一個絕對值賦給一個節定義內的
符號時有用。

`ADDR(SECTION)'
返回節SECTION的絕對地址(VMA)。你的指令碼之前必須已經定義了這個節的地址。在接下來的例子
中,'symbol_1'和'symbol_2'被賦以相同的值。

        SECTIONS { ...
          .output1 :
            {
            start_of_output_1 = ABSOLUTE(.);
            ...
            }
          .output :
            {
            symbol_1 = ADDR(.output1);
            symbol_2 = start_of_output_1;
            }
        ... }

`ALIGN(EXP)'
返回定位計數器'.'對齊到下一個EXP指定的邊界後的值。‘ALIGN’不改變定位計數器的值,它只是
在定位計數器上面作了一個算術運算。這裡有一個例子,它在前面的節之後,把輸出節'.data'對齊
到下一個'0x2000'位元組的邊界,並在輸入節之後把節內的一個變數對齊到下一個'0x8000'位元組的邊界。

        SECTIONS { ...
          .data ALIGN(0x2000): {
            *(.data)
            variable = ALIGN(0x8000);
          }
        ... }

這個例子中前一個'ALIGN'指定一個節的位置,因為它是作為節定義的可選項ADDRESS屬性出現的。第
二個‘ALIGN’被用來定義一個符號的值。

內建函式'NEXT'跟‘ALIGN’非常相似。

`BLOCK(EXP)'
這是'ALIGN'的同義詞,是為了與其它的聯結器保持相容。這在設定輸出節的地址時非常有用。

`DATA_SEGMENT_ALIGN(MAXPAGESIZE, COMMONPAGESIZE)'
    這跟下面的兩個表達同義:
        (ALIGN(MAXPAGESIZE) + (. & (MAXPAGESIZE - 1)))
    或者:
        (ALIGN(MAXPAGESIZE) + (. & (MAXPAGESIZE - COMMONPAGESIZE)))

隱式連線指令碼
=======================

如果你指定了一個聯結器輸出檔案,而聯結器不能識別它是一個目標檔案還是檔案檔案,它會試圖把它讀作
一個連線指令碼。如果這個檔案不能作為一個連線指令碼被分析,聯結器就會報告一個錯誤。

一個隱式的聯結器指令碼不會替代預設的聯結器指令碼。

一般,一個隱式的聯結器指令碼只包含符號賦值,或者'INPUT','GROUP'或'VERSION'命令。

BFD
***

聯結器通過BFD庫來對目標檔案和檔案檔案進行操作。這些庫允許聯結器忽略目標檔案的格式而使用相關的
例程來操作目標檔案。只要簡單地建立一個新的BFD後臺並把它加到庫中,一個不同的目標檔案格式就會被
支援。但是為了節約執行時記憶體,聯結器和相關的工具一般被配置為只支援可用的目標檔案格式的一個子集,
你可以使用'objdump -i'來列出你配置的所有支援的格式。

就像大多數的案例,BFD是一個在多種相互有衝突的需求之間的一個折中,影響BFD設計的一個最主要的因
素是效率。因為BFD簡化了程式和後臺,更多的時間和精力被放在了優化演算法以追求更快的速度。

BFD解決方案的一個副產品是你必須記住有資訊丟失的潛在可能。在使用BFD機制時,有兩處地方有用資訊可
能丟失:在轉化時和在輸出時。

它如何工作: BFD概要。
===============================

當一個目標檔案被開啟時,BFD子程式自動確定輸入目標檔案的格式。然後它們在記憶體中用指向子程式的指標
構建一個描述符,這個描述符被用作存取目標檔案的資料結構元素。

因為需要來自目標檔案的不同資訊,BFD從檔案的不同節中讀取它們,並處理。比如,聯結器的一個非常普遍
的操作是處理符號表。每一個BFD後臺提供一個在目標檔案的符號表達形式跟內部規範格式之間的轉化的函式,
當一個聯結器需要一個目標檔案的符號表時,它通過一個記憶體指標呼叫一個來自相應的BFD後臺的子程式,這
個子程式讀取表並把它轉化為規範表。然後,聯結器寫輸出檔案的符號表,另一個BFD後臺子程式被呼叫,以
建立新的符號表並把它轉化為選定的輸出格式。

資訊丟失。
----------------

在輸出的過程中,資訊可能會被丟失。BFD支援的輸出格式並不提供一致的特性,並且在某一種格式中可以被
描述的資訊可能在另一種格式中沒有地方可放。一個例子是在'b.out'中的對齊資訊,在一個'a.out'格式的
檔案中,沒有地方可以儲存對齊資訊,所以當一個檔案是從'b.out'連線而成的,併產生的是一個'a.out'的
檔案,對齊資訊就不會被傳入到輸出檔案中(聯結器還是在內部使用對齊資訊,所以聯結器的執行還是正確的)

另一個例子是COFF節名字。COFF檔案中可以含有不限數量的節,每一個都有一個文字的節名。如果連線的目標是
一種不支援過多節的格式(比如,'a.out')或者是一種不含有節名的格式(比如,Oasys格式),聯結器不
能像通常那樣簡單地處理它。你可以通過把所需的輸入輸出節通過連線指令碼語言進行詳細對映來解決這下問題。

在規範化的過程中資訊也會丟失。BFD內部的對應於外部格式的規範形式並不是完全詳盡的;有些在輸入格式
中的結構在內部並沒有對應的表示方法。這意味著BFD後臺在從外部到內部或從內部到外部的轉化過程中不能
維護所有可能的資料。

這個限制只在一個程式讀取一種格式並寫成另一種格式的時候會是一個問題。每一個BFD後臺有責任維護儘可能
多的資料,內部的BFD規範格式具有對BFD核心不透明的結構體,只匯出給後臺。當一個檔案以一種格式讀取後,
規範格式就會為之產生。同時,後臺把所有可能丟失的資訊進行儲存。如果這些資料隨後會寫以相同的格式寫
回,後臺程式就可以使用BFD核心提供的跟選前準備的相同的規範格式。因為在後臺之間有大量相同的東西,在
把big endianCOFF拷貝成littile endian COFF時,或者'a.out'到'b.out'時,不會有資訊丟失。當一些混合格
式被連線到一起時,只有那些格式跟目標格式不同的檔案會丟失資訊。

相關文章