揭開Linux作業系統的Swap交換區之謎

lishiran發表於2007-05-17
Swap,即交換區,除了安裝Linux的時候,有多少人關心過它呢?[@more@]

其實,Swap的調整對Linux伺服器,特別是Web伺服器的效能至關重要。透過調整Swap,有時可以越過系統效能瓶頸,節省系統升級費用。 Swap的原理是一個較複雜的問題,需要大量的篇幅來說明。在這裡只作簡單的介紹,在以後的文章中將和大家詳細討論Swap實現的細節。 眾所周知,現代作業系統都實現了“虛擬記憶體”這一技術,不但在功能上突破了實體記憶體的限制,使程式可以操縱大於實際實體記憶體的空間,更重要的是,“虛擬記憶體”是隔離每個程式的安全保護網,使每個程式都不受其它程式的干擾。 Swap空間的作用可簡單描述為:當系統的實體記憶體不夠用的時候,就需要將實體記憶體中的一部分空間釋放出來,以供當前執行的程式使用。那些被釋放的空間可能來自一些很長時間沒有什麼操作的程式,這些被釋放的空間被臨時儲存到Swap空間中,等到那些程式要執行時,再從Swap中恢復儲存的資料到記憶體中。這樣,系統總是在實體記憶體不夠時,才進行Swap交換。 計算機使用者會經常遇這種現象。例如,在使用Windows系統時,可以同時執行多個程式,當你切換到一個很長時間沒有理會的程式時,會聽到硬碟“嘩嘩”直響。這是因為這個程式的記憶體被那些頻繁執行的程式給“偷走”了,放到了Swap區中。因此,一旦此程式被放置到前端,它就會從Swap區取回自己的資料,將其放進記憶體,然後接著執行。 需要說明一點,並不是所有從實體記憶體中交換出來的資料都會被放到Swap中(如果這樣的話,Swap就會不堪重負),有相當一部分資料被直接交換到檔案系統。例如,有的程式會開啟一些檔案,對檔案進行讀寫(其實每個程式都至少要開啟一個檔案,那就是執行程式本身),當需要將這些程式的記憶體空間交換出去時,就沒有必要將檔案部分的資料放到Swap空間中了,而可以直接將其放到檔案裡去。如果是讀檔案操作,那麼記憶體資料被直接釋放,不需要交換出來,因為下次需要時,可直接從檔案系統恢復;如果是寫檔案,只需要將變化的資料儲存到檔案中,以便恢復。但是那些用malloc和new函式生成的物件的資料則不同,它們需要Swap空間,因為它們在檔案系統中沒有相應的“儲備”檔案,因此被稱作“匿名”(Anonymous)記憶體資料。這類資料還包括堆疊中的一些狀態和變數資料等。所以說,Swap空間是“匿名”資料的交換空間。 突破128M Swap限制 經常看到有些Linux(國內漢化版)安裝手冊上有這樣的說明:Swap空間不能超過128M。為什麼會有這種說法?在說明“128M”這個數字的來歷之前,先給問題一個回答:現在根本不存在128M的限制!現在的限制是2G! Swap空間是分頁的,每一頁的大小和記憶體頁的大小一樣,方便Swap空間和記憶體之間的資料交換。舊版本的Linux實現Swap空間時,用Swap空間的第一頁作為所有Swap空間頁的一個“位對映”(Bit map)。這就是說第一頁的每一位,都對應著一頁Swap空間。如果這一位是1,表示此頁Swap可用;如果是0,表示此頁是壞塊,不能使用。這麼說來,第一個Swap對映位應該是0,因為,第一頁Swap是對映頁。另外,最後10個對映位也被佔用,用來表示Swap的版本(原來的版本是Swap_space ,現在的版本是swapspace2)。那麼,如果說一頁的大小為s,這種Swap的實現方法共能管理“8 * ( s - 10 ) - 1”個Swap頁。對於i386系統來說s=4096,則空間大小共為133890048,如果認為1 MB=2^20 Byte的話,大小正好為128M。 之所以這樣來實現Swap空間的管理,是要防止Swap空間中有壞塊。如果系統檢查到Swap中有壞塊,則在相應的位對映上標記上0,表示此頁不可用。這樣在使用Swap時,不至於用到壞塊,而使系統產生錯誤。 現在的系統設計者認為: 1.現在硬碟質量很好,壞塊很少。 2.就算有,也不多,只需要將壞塊羅列出來,而不需要為每一頁建立對映。 3.如果有很多壞塊,就不應該將此硬碟作為Swap空間使用。 於是,現在的Linux取消了位對映的方法,也就取消了128M的限制。直接用地址訪問,限制為2G。 Swap配置對效能的影響 分配太多的Swap空間會浪費磁碟空間,而Swap空間太少,則系統會發生錯誤。 如果系統的實體記憶體用光了,系統就會跑得很慢,但仍能執行;如果Swap空間用光了,那麼系統就會發生錯誤。例如,Web伺服器能根據不同的請求數量衍生出多個服務程式(或執行緒),如果Swap空間用完,則服務程式無法啟動,通常會出現“application is out of memory”的錯誤,嚴重時會造成服務程式的死鎖。因此Swap空間的分配是很重要的。 通常情況下,Swap空間應大於或等於實體記憶體的大小,最小不應小於64M,通常Swap空間的大小應是實體記憶體的2-2.5倍。但根據不同的應用,應有不同的配置:如果是小的桌面系統,則只需要較小的Swap空間,而大的伺服器系統則視情況不同需要不同大小的Swap空間。特別是資料庫伺服器和Web伺服器,隨著訪問量的增加,對Swap空間的要求也會增加,具體配置參見各伺服器產品的說明。 另外,Swap分割槽的數量對效能也有很大的影響。因為Swap交換的操作是磁碟IO的操作,如果有多個Swap交換區,Swap空間的分配會以輪流的方式操作於所有的Swap,這樣會大大均衡IO的負載,加快Swap交換的速度。如果只有一個交換區,所有的交換操作會使交換區變得很忙,使系統大多數時間處於等待狀態,效率很低。用效能監視工具就會發現,此時的CPU並不很忙,而系統卻慢。這說明,瓶頸在IO上,依靠提高CPU的速度是解決不了問題的。 系統效能監視 Swap空間的分配固然很重要,而系統執行時的效能監控卻更加有價值。透過效能監視工具,可以檢查系統的各項效能指標,找到系統效能的瓶頸。本文只介紹一下在Solaris下和Swap相關的一些命令和用途。 最常用的是Vmstat命令(在大多數Unix平臺下都有這樣一些命令),此命令可以檢視大多數效能指標。 例如:
# vmstat 3 procs memory swap io system cpu r b w swpd free buff cache si so bi bo in cs us sy id 0 0 0 0 93880 3304 19372 0 0 10 2 131 10 0 0 99 0 0 0 0 93880 3304 19372 0 0 0 0 109 8 0 0 100 0 0 0 0 93880 3304 19372 0 0 0 0 112 6 0 0 100 …………


命令說明: vmstat 後面的引數指定了效能指標捕獲的時間間隔。3表示每三秒鐘捕獲一次。第一行資料不用看,沒有價值,它僅反映開機以來的平均效能。從第二行開始,反映每三秒鐘之內的系統效能指標。這些效能指標中和Swap有關的包括以下幾項: procs下的w 它表示當前(三秒鐘之內)需要釋放記憶體、交換出去的程式數量。 memory下的swpd 它表示使用的Swap空間的大小。 Swap下的si,so si表示當前(三秒鐘之內)每秒交換回記憶體(Swap in)的總量,單位為kbytes;so表示當前(三秒鐘之內)每秒交換出記憶體(Swap out)的總量,單位為kbytes。 以上的指標數量越大,表示系統越忙。這些指標所表現的系統繁忙程度,與系統具體的配置有關。系統管理員應該在平時系統正常執行時,記下這些指標的數值,在系統發生問題的時候,再進行比較,就會很快發現問題,並制定本系統正常執行的標準指標值,以供效能監控使用。 另外,使用Swapon-s也能簡單地檢視當前Swap資源的使用情況。例如:
# swapon -s Filename Type Size Used Priority /dev/hda9 partition 361420 0 3


能夠方便地看出Swap空間的已用和未用資源的大小。 應該使Swap負載保持在30%以下,這樣才能保證系統的良好效能。 有關Swap操作的系統命令 增加Swap空間,分以下幾步: 1)成為超級使用者 $su - root 2)建立Swap檔案 # dd if=/dev/zero of=swapfile bs=1024 count=65536 建立一個有連續空間的交換檔案。 3)啟用Swap檔案 #/usr/sbin/swapon swapfile swapfile指的是上一步建立的交換檔案。 4)現在新加的Swap檔案已經起作用了,但系統重新啟動以後,並不會記住前幾步的操作。因此要在/etc/fstab檔案中記錄檔案的名字,和Swap型別,如: /path/swapfile none Swap sw,pri=3 0 0 5)檢驗Swap檔案是否加上 /usr/sbin/swapon -s 刪除多餘的Swap空間。 1)成為超級使用者 2)使用Swapoff命令收回Swap空間。 #/usr/sbin/swapoff swapfile 3)編輯/etc/fstab檔案,去掉此Swap檔案的實體。 4)從檔案系統中回收此檔案。 #rm swapfile 5)當然,如果此Swap空間不是一個檔案,而是一個分割槽,則需建立一個新的檔案系統,再掛接到原來的檔案系統上。
該文章轉載自Pclala電腦大本營:

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/9099175/viewspace-915301/,如需轉載,請註明出處,否則將追究法律責任。

相關文章