有關oracle高可靠性的一些討論和想法(5)

jss001發表於2009-02-23
附件4:ROSE HA & ESCORT DA 雙機熱備架構方案


以下是一份雙機熱備份的方案大家可以參考參考,並沒有指定要用下面的產品,只是希望大家對雙機有一個瞭解
ROSE HA & ESCORT DA 雙機熱備架構方案

一、 前言
對 現代企業來說,利用計算機系統來提供及時可靠的資訊和服務是必不可少的;另一方面,計算機硬體與軟體都不可避免地會發生故障,這些故障有可能給企業帶來極 大的損失,甚至整個服務的終止,網路的癱瘓。可見,對一些特別的企業或公司,系統的高可用性顯得更為重要。因此,必須有適當的措施來確保計算機系統提供不 間斷的服務,以維護系統的可用性。

資訊系統的可用性通常在兩種情況下會受到影響,一種是系統當機、錯誤操作和管理引起的異常失敗,另一種是由於系統維護和升級,需要安裝新的硬體或軟體而正常關機。高可靠性軟體必須為這兩種情況提供不間斷的系統服務。

本方案正是經過了對軟、硬體產品的綜合考察,對各種雙機熱備份架構方案的深入分析而提出的。我們力圖向您提供完備、智慧化、易管理的雙機熱備份架構方案,從而為您的系統的高可用性建設盡綿薄之力。

二、 雙機熱備份架構方案
1、 網路拓撲圖


2、 採用的軟、硬體及其特點
? 磁碟陣列裝置
採用ESCORT DA-3500 P2D多網冗餘、雙高效能伺服器系統、磁碟陣列(RAID 0、1、3、5)等種方式來實現冗餘高可靠。
? 雙機軟體
ROSE HA
3、 系統特點
? 共用儲存裝置
採用硬碟陣列(Disk Array)作為共用存放裝置,以保證資料的可靠性和可恢復性,用於存放提供服務所必需的軟體和資料,避免和減少由於磁碟故障或錯誤所造成的損失。
? 開放性
支援各種流行的資料庫軟體(如:Oracle、Sybase、Informix、sql server等),以及其他的主流應用。
? 快速的反應速度
典型的錯誤檢測時間是5秒,服務轉移時間一般在10-120秒之間。
? 自動處理過程
錯誤檢測和服務轉移過程完全由ROSE HA軟體自動處理,不需要系統管理員干預。
? 圖形使用者介面
ROSE HA軟體以Java Applet的形式提供,系統管理者透過互動式介面來配置HA, 並且該介面實時地顯示出主機系統及服務的狀態。
? 靈活性
使用者可指定每臺伺服器的作用(avtive or standby),指定要監控的服務和硬體部份,定義指定的服務發生故障後要採取的進一步行動(如是否重新啟動該服務,允許的最大 啟動時間)。
? 可擴充性
使用者可透過增加服務來進一步提高系統的可用性。
? 豐富的附加功能
提供不同的針對特定應用的Agent程式,使服務監控更切實際,更加有效。
? 提供用於開發Agent程式的應用程式介面(API),使用者可針對特定的服務編寫執行狀態診斷及錯誤恢復工作的Agent程式。

三、 雙機熱備工作過程
系統起動後,ROSE HA首先啟動HA MANAGER管理程式,根據高可用性系統的配置結構初始化,然後啟動必要的服務和代理程式來監控和管理系統服務。HA代理程式用來監控、監測、診斷和管理硬體軟體服務。
代理程式檢測到該服務處理於活動狀態,HA MANAGER就會認為該服務處於活動狀態,HA MANAGER會定時通知後備伺服器上的HA MANAGER,其每項服務處於正常。
當代理程式檢測到某個服務發生故障時,它就通知HA MANAGER管理程式。HA軟體首先會重新起動該服務多次(可由使用者設定),如果啟動不能成功,該服務會由HA轉移到後備伺服器上。
HA週期性地檢測系統硬體的狀態,如果硬體發生故障,HA會把與該硬體相關的服務轉移到後備伺服器上。
當某項服務發生轉移時,HA首先在執行伺服器上停止該服務,之後,由備份伺服器上的HA在備份伺服器上啟動該服務。由於停止和啟動該服務都需要一定的時間,所以當服務被切換(轉移)時,該服務會有一個短暫的中斷,在切換完成後,該服務自動恢復正常執行。
考 慮到一些資料庫系統(如Oracle、Sybase、Informix等)以及其他一些應用軟體(如Domino Server、WWW Server等),ROSE HA在HA管理模組(HA Manager)的基礎上,提供了一系列的Agent軟體模組。Agent為一個軟體監視模組,監控資料庫服務或其他應用服務的執行。當執行伺服器發生故 障時,由Agnet檢測到之後,Agent向HA主控軟體請求,進行相應的處理動作。

ROSE HA軟體極大程度上減少了人的介入,提高了系統的可靠性與安全性,使服務能高可靠的執行.。[@more@]

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/18921899/viewspace-1016885/,如需轉載,請註明出處,否則將追究法律責任。

相關文章