ROSE 雙機熱備軟體簡介

lenx2000發表於2009-08-03

ROSE HA是美國ROSE Datasystem 公司出品的新一代高可用性軟體,它可以將UNIX伺服器和Windows 伺服器組成叢集系統,並對伺服器進行監控、故障檢測、故障恢復,保護執行伺服器中的關鍵性資料服務和網路服務。對於在客戶機/伺服器環境中的網路及資料庫中整合的高可用需求,ROSE HA提供了非常靈活而且適用的解決方案。

1) ROSE HA 的主要功能特點

介面友好:ROSE HA 提供了友好直觀的圖形安裝介面和監控管理介面。透過直觀而又方便的JAVA Applet管理介面,使用者可以互動式地對叢集系統進行配置、監控和管理,並可以利用Applet的網路特性,透過網路對系統進行遠端管理。

支援Active-Active模式和Active-Standby模式:ROSE 高可用性軟體支援Active-Active模式和Active-Standby模式。使用者可指定每臺伺服器的作用(active or standby),指定要監控的服務和硬體部分,定義指定的服務發生故障後要採取的進一步行動(如是否重新啟動該服務、允許的最大啟動時間等)。

支援多條心跳路徑:可以將網線和RS-232串列埠線作為在叢集系統上執行的ROSE HA的心跳線。配置多條心跳路徑可以避免系統的單點故障。

自動切換:當系統出現故障時(如:系統當機、HA程式/應用程式被殺掉、RS-232/SCSI/網路線纜斷開),ROSE HA 將確定由於某種故障而終止的應用,並將這些應用切換到備份伺服器上。而故障伺服器中未受影響的應用不會被切換,既不會受任何影響。

自動檢測:在叢集系統的每一臺伺服器內,ROSE HA 具有兩個核心程式,他們互相監控(如:系統當機、HA程式被殺掉、RS-232、網路、SCSI線纜是否斷開),如果其中一個程式失敗,另一個程式會立即進行恢復。

2) ROSE HA其它高可用效能

為了對系統實現有效的保護,要求HA軟體要能夠檢查出可能發生的系統/網路故障。為了構造一個高可靠的叢集系統,ROSE HA 從多方面提供了完整的解決方案,包括管理,監控,檢測和恢復。

伺服器可靠性: 在伺服器出現故障(如掉電或當機)時,另外一臺伺服器接管故障伺服器上執行的所有的關鍵性應用。

網路可靠性:如果伺服器的網路部分發生故障,會導致客戶不能連線和訪問到伺服器,這同樣是致命的故障。如果該伺服器配備了冗餘的網路介面,ROSE HA 會使用它來恢復網路連線。在沒有配備冗餘的網路介面,或者所有的網路介面均出現故障時,HA會將該應用切換到另外一臺伺服器上。切換完成後,客戶在短暫的切換過程後能夠繼續訪問所需的服務。

磁碟可靠性:需要將應用的全部資料儲存在兩臺伺服器都能訪問到的共享磁碟中。建議使用磁碟陣列來儲存資料,這樣可以避免單點失敗,而且便於對系統的容量進行擴充。對由Volume Manager管理的磁碟陣列,ROSE HA提供了相應的處理程式,以保證磁碟陣列及資料的可靠性。

檔案系統可靠性:UNIX標準的檔案系統(UFS)並未考慮到高可用性系統的需求,使用UFS的伺服器在當機、掉電等非正常關機後,會導致檔案系統中資料的丟失和衝突。建議在高可用系統中儘量使用改進的VxFS或jUFS,它們能夠對檔案系統的修改和更新進行記錄,在出現錯誤時,檔案系統能夠自動地檢測並進行快速的恢復。

應用可靠:在高可用性系統中可以執行多個應用。每一個應用是作為一個服務而存在的。在伺服器中,當某個服務失敗而其它服務正常執行時,ROSE HA將處理這個失敗的服務。在將這個服務切換到另一臺伺服器上時,該伺服器上執行的服務也不會受到影響。對於與網路不相關的純資料應用,只需要切換資料儲存和資料處理軟體。而在與網路相關的客戶機/伺服器應用,除了要切換資料儲存和資料處理軟體外,還需要切換相關的虛擬IP。如果希望兩個服務獨立地進行切換,則此兩個IP地址不能相同。如果使用了相同的IP地址,在發生切換時,ROSE HA會將所有使用該IP的服務都切換到另外一臺伺服器上去。

3) ROSE HA執行過程

在系統啟動後,ROSE HA首先會啟動HA Daemon,根據高可用性系統的配置結構進行初始化,然後會啟動相應的服務和代理程式來監控和管理系統服務。

如果該代理程式檢測到服務處於活動狀態,HA Daemon就會認為該服務處於活動狀態,並會定時通知後備份伺服器上的HA Daemon,告知對方其每項服務處於正常狀態。

當代理程式檢測到某個服務發生故障時,它就通知HA Daemon管理程式。此時,HA軟體首先會按使用者設定的重啟次數重新啟動該服務,如果啟動不成功,該服務會由HA轉移(切換)到備份伺服器上。

HA週期性地檢測系統的硬體狀態,如果硬體發生故障,HA會把與該故障硬體相關的服務轉移到備份伺服器上。

當發生服務轉移時,HA首先會在執行伺服器上停止該服務及相應的Agent之後,在備份伺服器上由HA將該服務和相應的Agent啟動。由於停止和啟動該服務都需要一定的時間,所以當服務被切換(轉移)時,該服務會有短暫的中斷,轉移完成後,服務自動恢復正常執行。

4) ROSE HA的配置

 在GUI介面中完成對ROSE HA的配置是一件非常方便而且有效的事情,系統管理員只要在相應的配置表中填入相應的內容,即可完成對ROSE HA的配置。對ROSE HA的配置共包括這樣一些內容:License Information、Server NIC Configuration、Private Net Configuration和Service Configuration。在配置完這些基本內容後,系統管理員還可以根據自己的實際環境要求和應用的變化作相應的修改和增加。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/11134849/viewspace-611300/,如需轉載,請註明出處,否則將追究法律責任。

相關文章