用了這麼久的熱插拔 才知道里面原理是什麼

HitTwice發表於2018-05-07

多節點伺服器具備諸多優勢,尤其是單位空間內整合了更多的處理器及I/O裝置,極大降低了使用者的空間使用成本並顯著提高了整體計算能力,但高度整合化的負面結果就是內部結構更加複雜,系統穩定性受到嚴重挑戰,內部散熱問題也趨於嚴重化,維護和管理也更加複雜。如果沒有相關的技術革新,每個伺服器故障都需要使用者關閉系統、斷電解決,該是多麼可怕的事情?

用了這麼久的熱插拔 才知道里面原理是什麼

我們知道,在伺服器裡可實現熱插拔的部件主要有硬碟、CPU、記憶體、電源、風扇、PCI介面卡、網路卡等。購買伺服器時一定要注意哪些部件能夠實現熱插拔,這對以後的工作至關重要,最重要的就是支援24*365不間斷執行,以便保證商業網站、電信系統、銀行系統等的持續運轉。

首先,RAID技術、UPS、風扇冗餘等都是為了在相關部件出現故障時,保證使用者能夠在系統正常執行的同時,進行線上維護。而熱插拔是指在系統到店的工作狀態下,將模組、卡或聯結器查到系統上,而不影響系統的操作。

現在,熱插拔技術在確保伺服器系統可用性已顯得越來越重要了,已成為伺服器的標準技術。儘管不同檔次的伺服器所支援的熱插拔配件並不完全一樣,但對於像硬碟、電源和風扇的熱插拔技術支援已成為比較常見的伺服器配置了。

用了這麼久的熱插拔 才知道里面原理是什麼

實現熱插拔需要有以下幾個方面支援:匯流排電氣特性、主機板BIOS、作業系統和裝置驅動。那麼我們只要確定環境符合以上特定的環境,就可以實現熱插拔。通常來說,一個完整的熱插拔系統包括熱插拔系統的硬體,支援熱插拔的軟體和作業系統,支援熱插拔的裝置驅動程式和支援熱插拔的使用者介面。

熱插拔的目的是將高的瞬間電流控制在一個比較低而且合理的水平。其實現方法有幾種,其中使用PTC(正溫度係數的熱敏電阻),是最簡單的方法。PTC依靠本身的電流發熱改變阻抗,從而降低瞬間電流的幅度,其缺點是反應速度慢,而且長時間使用會影響使用壽命。MOS管電流檢測電阻加上一些簡單的電阻電容延遲線路的方法成本低,比較適於低端用途。最好的方法是採用熱插拔晶片,通常該晶片包含一個驅動MOS設計和電流檢測電阻,它除了做基本熱插拔之外,還可以提供特殊功能,如控制電流上升速率、做斷電器、電源管理以及狀態報告等,能夠提升系統的工作狀態。

用了這麼久的熱插拔 才知道里面原理是什麼

但是記憶體要實現熱插拔,就遠不止這麼簡單。於是那些不安分的巨頭伺服器商就開始了自己的記憶體熱插拔技術的研究,相繼出臺了這樣和那樣的技術,不過比起比起傳統的ECC技術來說,效能是提高了不少。

總之,在機箱中使用熱插拔,可以在開機的情況下做更新或擴容而不影響系統操作;並且,由於熱插拔零件的可靠度提升,還可以將它們用做段電時的處理,使硬碟等部件不至於斷電或損壞而機器整機關閉,以便系統做故障分析,減少成本。

本文作者:張存

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31473948/viewspace-2153917/,如需轉載,請註明出處,否則將追究法律責任。

相關文章