異地容災系統技術概述(轉載)

fjy26發表於2008-04-08
隨著中國企業、行業資訊化過程的推進,資料保護的重要性已越來越成為人們關注的焦點。大型公司、組織或政府部門經常需要面對的一個課題是如何避免在各種自然災害和人為破壞的情況下保障其系統的安全有效。傳統的離線備份、備份介質異地儲存的方法可以在一定的程度上解決上述課題。但隨著業務對系統可用性、實時性要求的提高,遠端容災成為保障使用者需求的唯一選擇。   廣義上講,任何必須恢復的資料訪問中斷都是資料災難。容災就是能夠恢復資料災難發生前的系統狀態的方法。遠端容災系統是指在相隔較遠的異地,建立兩套或多套功能相同的系統,互相之間可以進行健康狀態監視和功能切換。當一處系統因災害(如水災、火災、人為破壞或地震等)停止工作時,整個應用系統可以切換到另一處,使得該系統功能可以繼續正常工作。實際上從從技術上講,典型的容災系統一般包括兩個主要的功能部分:   1、資料複製:指在異地保證各個系統關鍵資料和狀態引數的一致,根據其實現的方法來分可以是軟體的方式,也可以是硬體的方式。軟體方式是在主系統和容災系統的主機上,安裝專用的資料複製軟體。這種方式的特點是成本較低。但是由於效率和可管理性方面的問題,這種容災方式不多見。大多數的容災系統都採用硬體方式的資料複製,即資料透過儲存陣列控制器直接在儲存裝置之間傳輸,由於資料複製是由光纖通道儲存陣列控制器完成,因此不佔用伺服器記憶體等寶貴的硬體資源,也不須由作業系統進行管理和控制,對作業系統資源不會造成佔用,對系統效率也不會造成影響。同時根據實現的步驟來將也可以分為同步複製(實時容災)和非同步複製(非同步容災),同步複製是安全級別最高的工作方式。具體工作時主系統主機向本地的儲存裝置傳送一個I/O請求時,這個請求同時被傳送到容災系統的儲存裝置中,等到2個儲存裝置都處理完成後,才向主系統主機返回確認訊號。這一機制確保在2個儲存裝置中的資料在資料塊級別的高度一致。而非同步複製的工作機制是主系統內主機與儲存裝置間的I/O處理與資料複製過程無關,也就是說,主機無須等待遠端儲存裝置完成I/O處理,只要本地主系統儲存裝置完成IO處理後,即向主系統主機傳送確認訊號。這樣,雖然主系統與容災系統之間資料複製的通訊效率高會提高,但是2個儲存裝置中的資料就可能存在不一致,這也就是採用非同步複製機制的代價。   2、應用切換:即當某個具體應用在一個系統中失效之後,可以在另外一個系統中啟動切換並接管該網路服務。每次進行事務處理時,資料均同步更新。當主業務中心發生災難時,遠端備份中心子系統中的資料將安然無恙,並且透過備用主機連線而保證資料的可用。自動的儲存子系統故障恢復和故障返回功能允許線上操作繼續進行,只需要將客戶端與遠端子系統重新聯結即可恢復業務運作。透過建立額外的映象,該方案可實現並行操作。   我公司在容災體系中採用FalconStor的 IPStor軟體和Legato的Legato Automated Availability Manager ( Legato Cluster)IPStor使儲存和應用分離,儲存伺服器管理所有的儲存裝置,應用伺服器只需管理自己的系統盤。儲存資料的磁碟子系統由IPStor伺服器統一協調管理,減小了徵管伺服器的工作量和工作難度。本地到異地的容災複製也有IPSTOR伺服器完成。Legato Automated Availability Manager (LAAM)提供區域網或廣域網內任務的監控、切換,透過和底層的IPSTOR配合來達到遠端的CLUSTER,達到提高應用的速度和容災的目的。[@more@]

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/74617/viewspace-1002114/,如需轉載,請註明出處,否則將追究法律責任。

相關文章