備份與應急恢復系統功能實現(轉)

coolhe發表於2010-08-18

http://www.yxhdd.com/newshow.asp?id=63&mnid=67&classname=news

備份是一個老生常談的話題,但真正能做好的企業並不多。對於一個分散式企業生產資料管理系統來說,其備份與應急恢復系統的建立能夠完善備份與應急方案機制,增強系統應對各種風險的能力,確保其安全、穩定、高效地執行。

為了確保企業生產資料管理系統中資料的完整性和安全性,以及應用的不間斷穩定性,我們針對系統的應急和備份特點,對現有市場中的備份產品進行了分析、調研、測試和研究,並針對如何在確保資料安全的基礎上提高業務連續執行能力,降低企業運營風險,提出了一套備份與應急恢復解決方案。

流行的備份技術

目前,國內外流行的備份技術包括磁碟映象技術、網路盤儲存映象技術、雙機熱備技術、叢集執行技術、資料後備+增量資料備份技術等。

磁碟映象技術簡單實用,備份效率高,但不能解決除磁碟外的伺服器故障問題,也不能解決作業系統中病毒,或者人為資料破壞等問題。

網路盤儲存映象技術採用網路資料儲存、資料複製、iSCSI及網路啟動等多項技術,為應用系統提供從系統到資料全方位的保護和快速恢復。它的優點是按物理儲存塊進行讀寫,可以備份任何系統、軟體、程式(包括基於各種方法加密的內容)。

雙機熱備是常用的災備方法,一般分為兩種:一種是基於共享的儲存裝置方式,另一種是沒有共享的儲存裝置方式,常稱為純軟體方式。但因為它是一種共享的邏輯備份複製,所以,部分加密軟體雖可做備份,但無法恢復執行,門戶管理軟體TWS就是這樣的系統。

叢集執行技術主要用來做系統負載均衡執行,但也可以作為系統備份技術,是一種實時災備系統。但這種技術需要有應用軟體的支援才能部署執行,所以,實際實施中會有一定的限制。

資料後備+增量資料備份與雙機熱備的純軟體方式類似,但它不是一個同步執行的系統。

我們的企業生產資料管理系統是一套實時的系統,我們對其系統面臨的各種風險因素做了全面分析,明確了備份與應急恢復的要求,對以上應急和資料備份技術進行了有針對性的全面調研,並在此基礎上提出了備份與應急系統的總體技術解決方案

如何選擇方案

我們的企業生產資料管理系統採用集中+分佈的體系架構,伺服器涉及幾十臺Windows伺服器和十幾臺Sun Solaris資料庫伺服器,儲存採用SAN架構方式,網路使用企業內部網,其應用主要是專用的應用軟體,執行在Windows平臺上,後臺資料管理是Oracle資料庫。應急恢復與生產資料備份的目標是實現應用系統的7×24小時穩定執行、生產資料在任何情況下都不能丟失,系統出現故障時能夠以本地和遠端異地兩種方式快速恢復。根據伺服器上執行的軟體,我們分為以下兩種情況進行討論。

1. 應用伺服器的應急恢復

應用伺服器要實現7×24小時穩定執行,當應用伺服器(包括作業系統和應用環境)受病毒攻擊或其他因素干擾而無法執行或出現主機癱瘓等災難時,能夠在本地和遠端異地啟動應急伺服器系統接管災難伺服器。經過充分的調研,我們發現,“網路盤儲存映象”是目前市場上比較先進的應急和備份技術,能夠有效地滿足其系統應用伺服器應急恢復的要求。其工作原理是在主應用伺服器和應急應用伺服器的儲存盤之間通過網路進行實時增量映象複製,並進行多版本快照儲存,但當某個油田應用伺服器發生災難時,通過網路恢復在本地或異地的應急伺服器上儲存的某個版本的映象備份,實現本地或遠端應用伺服器的接管。由於“網路盤儲存映象”通常都儲存多版本快照,因此,可以有效地防止病毒。

2. 資料庫伺服器的備份與恢復

對資料庫伺服器的備份與恢復,目前市場上的商業產品通常有兩種技術實現方式:一種方式是使用資料庫準同步技術,在邏輯層實現生產資料庫和備份資料庫之間的準同步而達到備份的目的另一種方式是通過網路盤儲存映象技術,在生產資料庫和備份資料庫之間實現物理層的複製與恢復。當本地生產資料伺服器發生故障時,由本地或總部異地的資料庫備份系統替代原主伺服器快速恢復生產資料應用。對於這兩種方式,我們進行了實際測試和效能對比,以及使用者的可操作和維護性,最終我們選擇使用資料庫準同步技術實現資料庫伺服器的備份與恢復。

實現哪些功能

備份與應急恢復與其他任何保險策略一樣,當沒有災難出現時,我們根本無法意識到備份與應急恢復系統所起到的作用,無法回收備份與應急恢復系統建設所需的大量投資。但從系統安全性角度考慮,我們又必須為關鍵的業務支撐系統建設最有效的備份與應急恢復解決方案。為此,備份與應急系統在實現中提供以下功能:

1. 應用伺服器的應急恢復(Windows平臺)

·作業系統與應用環境線上實時複製與恢復。包括線上實時增量複製/恢復作業系統和應用環境和資料按使用者指定的應用和資料目錄進行復制和恢復支援多版本快速回滾啟動恢復。

·作業系統與應用環境的本地應急恢復。在本地主機儲存發生損壞或因任何其他(如病毒)軟體原因發生故障時,應急系統上能網路啟動作業系統和應用環境,以快速恢復業務運營實現多版本快速回滾啟動,以消除可能的病毒故障。

·作業系統與應用環境的異地應急恢復。將本地應急系統的系統、環境和資料遠端同步到異地應急系統中心支援資料加密後傳輸,保證異地操作的資料安全在本地主機發生故障時,需要異地應急系統的備用主機能從異地應急系統上啟動作業系統和應用,以快速恢復業務運營。

2. 資料庫伺服器的備份與恢復(Solaris平臺)

·Oracle資料庫線上實時備份與恢復。能夠對生產資料庫(Oracle)進行線上實時的增量備份和恢復備份系統對生產系統和資料庫無干擾,即不需要安裝非原廠家的Agent軟體,或者安裝的軟體對生產系統無負面影響。

·Oracle資料庫的本地應急恢復。在本地主機儲存發生損壞或因任何其他軟體原因發生故障時,能立即從應急系統上啟動Oracle資料庫,以快速恢復業務運營保持備份資料和源資料的一致性和完整性,並能立即可用支援不同 Solaris作業系統版本上的資料庫(即Solaris 8 上的資料庫和 Solaris 9上的資料庫)之間的備份與恢復。

·Oracle資料庫的異地應急恢復。將本地應急系統的Oracle資料同步到異地應急系統中心支援資料加密傳輸,保障資料安全在本地主機發生故障時,需要異地應急系統的備用主機能從異地應急系統上啟動Oracle資料庫,以快速恢復業務運營。

備份與應急恢復系統的實現,將大大提高企業生產資料管理系統應用伺服器和資料庫伺服器的災備能力,能夠及時、準確地實時動態備份和恢復,保證其系統的資料安全和業務的連續性。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/3090/viewspace-671238/,如需轉載,請註明出處,否則將追究法律責任。

相關文章