伺服器記憶體技術

tonykorn97發表於2006-01-04

在計算機中使用的記憶體儲裝置主要有兩種型別:靜態隨機儲存器(SRAM)和動態隨機儲存器(DRAM)。其中SRAM作為快取使用,這是因為它的速度快,並可以在關閉電影前一直儲存其中的資料;而DRAM晶片裝在168腳的DIMM(dual inline memory modules)上。每一個DRAM晶片以電容行或電容列儲存資料(即儲存單元),對這些儲存單元必須不停的進行充電或者更新,否則其中的資料就會丟失。

奇偶校驗技術

對於記憶體中的“奇偶校驗(Praity)”技術的介紹要從位元的概念說起。走私數位電路中物件的資料單位就是位元(bit),也叫資料“位”,是記憶體中的最小單位。

位元是透過“1”和“0”來表示資料高,低電平訊號的。在數位電路中我們是將8哥連續的位元叫做一個字句(byte),在不帶“奇偶校驗”的記憶體中的每個位元組只有8位,若它的某一位儲存出現了錯誤,就會使其中儲存的相應資料發生改變而導致應用程式發生錯誤。而帶有“奇偶校驗”的記憶體在每一位元組(8位)外有額外增加了一位進行錯誤檢測。當CPU返回讀取的儲存資料時,它會再次將前8位中儲存的資料的計算結果與校驗位的值比較是否一致,當CPU發現兩者不同時,就檢視糾正這些錯誤。但Parity有一個缺點,當記憶體查到某個資料位有錯誤時,卻並布一定能取得錯誤的資料出在那一個位,也就布一定能修正錯誤,所有帶有奇偶校驗的記憶體的主要功能僅是“發現錯誤”,並能糾正部分簡單的錯誤。

ECC記憶體糾錯技術

ECC的英文全稱是“Error Checking and Correcting”(錯誤檢查和糾正)

與奇偶校驗技術一樣,ECC糾錯技術也需要額外的空間來儲存校正碼,但其中佔用的位數跟資料的長度並非成線性關係。具體來說,它是一8位資料,5位ECC碼位基準,隨後每增加一個8位資料只需增加一位ECC碼即可。

ECC碼將資訊進行8位元位的編碼,採用這種方式可以恢復1位元的錯誤。每當資料寫如記憶體的時候,ECC碼使用一種特殊的演算法對資料進行計算,其結果稱為校驗位(check bits).

將所有校驗位加在一起的和是“校驗和”(check sum),校驗和與資料一起存放。當這些資料從記憶體中讀出時,採用同一演算法再次計算校驗和,並和前面的計算結構相比較。當出現錯誤時ECC可以從邏輯上分類錯誤並通知系統,當只出現但位元錯誤的時候,ECC可以拔錯誤改正過來而不影響系統執行。

除了能夠檢查並改正單位元錯誤之外,ECC碼還能檢查到(但不改正)單DRAM晶片上發生的任意2哥隨機錯誤,並最多可以檢查到4位元的錯誤。當有多位元錯誤發生的時候,ECC記憶體會生成一個不可隱藏的中斷(non-maskable interrupt, NMI),系統會中止執行以避免出現資料惡化。

IBM伺服器記憶體技術

Chipkill記憶體技術

它的原理是這樣的:在Chipkill技術的支援下,單一記憶體晶片無論資料寬度是多少,只有一個給定的ECC識別碼,它的影響最多為一位元。舉個例子就是,如果使用4位元寬的SDRAM,4位元中的每一位的奇偶性將分別組成不同的ECC識別碼,每個ECC單元可以單獨用一個資料位來儲存,也就是說這些識別碼分別儲存在不同的記憶體空間中。因此,即使整個記憶體晶片出了故障,每個ECC單元也將最多出現一位元壞資料。出現這種情況完全可以透過ECC進行邏輯修復,從而保證了系統的容錯性。

Chipkill記憶體控制器所提供的儲存保護概念和具有校驗功能的磁碟陣列類似。在寫資料的時候,把資料寫到多個DIMM記憶體晶片上。這樣,每個DIMM所起的作用和儲存陳列相同。如果其中任何一個晶片失效了,它只能影響到一個資料位元組的某一位元。因此其他位元儲存在另外的晶片上。

大容量高速度技術

IBM的Active Memory(活動記憶體)的“大記憶體容量(Large Memory Capacity)”和“高速記憶體存取(High-Speed Memory Access)”技術的退出解決了記憶體技術進展落後於磁碟儲存,出來器技術和完了頻寬發展的速度。

記憶體保護(Memory ProteXion)

它的工作原理與硬碟的熱備份類似。當某個DIMM儲存晶片失效的時候,記憶體保護技術能夠自動利用北約的位元位找回資料。改技術可以糾正發生在每個DIMM記憶體中多達4個連續位元位的錯誤。當出現隨機性的軟記憶體錯誤時,可以透過使用熱備份的位元位來解決;如果出現永久性的硬體錯誤,也將利用熱備份的位元位使得DIMM記憶體晶片繼續工作,直到被替換為止。

它的工作方式有點類似在windows NT的NTFS檔案系統下的線上備份磁碟扇區:當作業系統在磁碟上檢測到壞的磁碟扇區的時候,它將在另外的扇區中寫下這些資料留做備用。我們可以認為記憶體保護技術就是提供線上備份的資料位。

記憶體映象(Memory Mirroring)技術

原理:資料同時寫入到兩個獨立的記憶體卡中(兩個記憶體卡的配置是一樣的),平時記憶體資料讀取只在機會的記憶體卡中進行。如果一個記憶體中發生足以引起系統報警的軟故障,系統頻繁報告系統管理員這個記憶體條將要出來故障,或者整個記憶體條都要徹底損壞,伺服器就會自動地切換到映象記憶體卡,直到有故障的記憶體被更換。

Hp伺服器記憶體技術

HP新ECC記憶體技術類似於IBM的Chipkill記憶體技術。

映象記憶體方式

1, 單儲存板配置-非熱插拔方式(Non-Hot Plug)

2, 雙儲存板配置的映象記憶體模式

熱插拔RAID記憶體(Hot Plug RAID Memory)技術

下一代伺服器的記憶體系統架構-FB-DIMM

FB-DIMM是inter開發的一種記憶體模租技術,並不是一種新的記憶體晶片技術,它改變了傳統DIMM並行斷線連線的記憶體子系統的系統架構。FB-DIMM採用的是一種新型的序列點對點連線的結構,類似於PCI Express的訊號匯流排。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/312079/viewspace-245279/,如需轉載,請註明出處,否則將追究法律責任。

相關文章