linux記憶體管理機制

tonykorn97發表於2006-11-12
以下主要說明swap和buffer cache機制
Linux支援虛擬記憶體(virtual memory),虛擬記憶體是指使用磁碟當作RAM的擴充套件,這樣可用的記憶體的大小就相應地增大了。核心會將暫時不用的記憶體塊的內容寫到硬碟上,這樣一來,這塊記憶體就可用於其它目的。當需要用到原始的內容時,它們被重新讀入記憶體。這些操作對使用者來說是完全透明的;Linux下執行的程式只是看到有大量的記憶體可供使用而並沒有注意到時不時它們的一部分是駐留在硬碟上的。當然,讀寫硬碟要比直接使用真實記憶體慢得多(要慢數千倍),所以程式就不會象一直在記憶體中執行的那樣快。用作虛擬記憶體的硬碟部分被稱為交換空間(swap space)。


一般,在交換空間中的頁面首先被換入記憶體;如果此時沒有足夠的實體記憶體來容納它們又將被交換出來(到其他的交換空間中)。如果沒有足夠的虛擬記憶體來容納所有這些頁面,Linux就會波動而不正常;但經過一段較長的時間Linux會恢復,但此時系統已不可用了。


有時,儘管有許多的空閒記憶體,仍然會有許多的交換空間正被使用。這種情況是有可能發生的,例如如果在某一時刻有進行交換的必要,但後來一個佔用很多實體記憶體的大程式結束並釋放記憶體時。被交換出的資料並不會自動地交換進記憶體,除非有這個需要時。此時實體記憶體會在一段時間內保持空閒狀態。對此並沒有什麼可擔心的,但是知道了是怎麼一回事,也就無所謂了。


許多作業系統使用了虛擬記憶體的方法。因為它們僅在執行時才需要交換空間,以解決不會在同一時間使用交換空間,因此,除了當前正在執行的作業系統的交換空間,其它的就是一種浪費。所以讓它們共享一個交換空間將會更有效率。

注意,如果會有幾個人同時使用這個系統,他們都將消耗記憶體。然而,如果兩個人同時執行一個程式,記憶體消耗的總量並不是翻倍,因為內碼表以及共享的庫只存在一份。


Linux系統常常動不動就使用交換空間,以保持儘可能多的空閒實體記憶體。即使並沒有什麼事情需要記憶體,Linux也會交換出暫時不用的記憶體頁面。這可以避免等待交換所需的時間:當磁碟閒著,就可以提前做好交換。

可以將交換空間分散在幾個硬碟之上。針對相關磁碟的速度以及對磁碟的訪問模式,這樣做可以提高效能。

高速緩衝

與訪問(真正的)的記憶體相比,磁碟的讀寫是很慢的。另外,在相應較短的時間內多次讀磁碟同樣的部分也是常有的事。例如,某人也許首先閱讀了一段e-mail訊息,然後為了答覆又將這段訊息讀入編輯器中,然後又在將這個訊息複製到資料夾中時,使得郵件程式又一次讀入它。或者考慮一下在一個有著許多使用者的系統中 ls命令會被使用多少次。透過將資訊從磁碟上僅讀入一次並將其存於記憶體中,除了第一次讀以外,可以加快所有其它讀的速度。這叫作磁碟緩衝(disk buffering),被用作此目的的記憶體稱為高速緩衝(buffer cache)。

但是,由於記憶體是一種有限而又不充足的資源,高速緩衝不可能做的很大(它不可能包容要用到的所有資料)。當緩衝充滿了資料時,其中最長時間不用的資料將被捨棄以騰出記憶體空間用於新的資料。

對寫磁碟操作來說磁碟緩衝技術同樣有效。一方面,被寫入磁碟的資料常常會很快地又被讀出(例如,原始碼檔案被儲存到一個檔案中,又被編譯器讀入),所以將要被寫的資料放入緩衝中是個好主意。另一方面,透過將資料放入緩衝中,而不是將其立刻寫入磁碟,程式可以加快執行的速度。以後,寫的操作可以在後臺完成,而不會拖延程式的執行。

大多數作業系統都有高速緩衝(儘管可能稱呼不同),但是並不是都遵守上面的原理。有些是直接寫(write-through):資料將被立刻寫入磁碟(當然,資料也被放入快取中)。如果寫操作是在以後做的,那麼該快取被稱為後臺寫(write-back)。後臺寫比直接寫更有效,但也容易出錯:如果機器崩潰,或者突然掉電,緩衝中改變過的資料就被丟失了。如果仍未被寫入的資料含有重要的薄記資訊,這甚至可能意味著檔案系統(如果有的話)已不完整。


針對以上的原因,出現了很多的日誌檔案系統,資料在緩衝區修改後,同時會被檔案系統記錄修改資訊,這樣即使此時系統掉電,系統重啟後會首先從日誌記錄中恢復資料,保證資料不丟失。當然這些問題不再本文的敘述範圍。

由於上述原因,在使用適當的關閉過程之前,絕對不要關掉電源,

sync命令傾空(flushes)緩衝,也即,強迫所有未被寫的資料寫入磁碟,可用以確定所有的寫操作都已完成。在傳統的UNIX系統中,有一個叫做update的程式執行於後臺,每隔30秒做一次sync操作,因此通常無需手工使用sync命令了。Linux另外有一個後臺程式,bdflush,這個程式執行更頻繁的但不是全面的同步操作,以避免有時sync的大量磁碟I/O操作所帶來的磁碟的突然凍結。

在Linux中,bdflush是由update啟動的。通常沒有理由來擔心此事,但如果由於某些原因bdflush程式死掉了,核心會對此作出警告,此時你就要手工地啟動它了(/sbin/update)。

快取(cache)實際並不是緩衝檔案的,而是緩衝塊的,塊是磁碟I/O操作的最小單元(在Linux中,它們通常是1KB)。這樣,目錄、超級塊、其它檔案系統的薄記資料以及非檔案系統的磁碟資料都可以被緩衝了。

緩衝的效力主要是由它的大小決定的。緩衝太小的話等於沒用:
它只能容納一點資料,因此在被重用時,所有緩衝的資料都將被傾空。實際的大小依賴於資料讀寫的頻次、相同資料被訪問的頻率。只有用實驗的方法才能知道。

如果快取有固定的大小,那麼快取太大了也不好,因為這會使得空閒的記憶體太小而導致進行交換操作(這同樣是慢的)。為了最有效地使用實際記憶體,Linux自動地使用所有空閒的記憶體作為高速緩衝,當程式需要更多的記憶體時,它也會自動地減小緩衝的大小。


這就是一般情況下linux記憶體的一般機制,當然linux記憶體的執行機制遠遠比這個複雜,但是隻有了解了這個機制,我們管理伺服器才能得心應手!

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/312079/viewspace-245520/,如需轉載,請註明出處,否則將追究法律責任。

相關文章