資料備份與複製

jelephant發表於2014-01-20

備份

資料備份(Backup)一般是指利用備份軟體(如Veritas的NetBackup、CA的BrightStor等)把資料從磁碟備份到磁帶進行離線儲存(最新的備份技術也支援磁碟到磁碟的備份,也就是把磁碟作為備份資料的存放介質,以加快資料的備份和恢復速度)。備份資料的格式是磁帶格式,不能被資料處理系統直接訪問。在源資料被破壞或丟失時,備份資料必須由備份軟體恢復成可用資料,才可讓資料處理系統訪問。相關問題:備份視窗恢復時間備份間隔資料的可恢復性介質的保管和運送備份的成本

資料備份(Backup):受備份策略、備份資料可恢復性等問題影響,不適合於在高等級的容災方案(RPO小於24小時)作為構建備份資料系統主要的技術。但由於實施方便,成本低廉,適合於低等級的容災方案中,也可作為高等級容災方案的輔助技術。在應用停機的情況下進行資料備份就不存在資料一致性問題,當需要線上備份時,一般由備份軟體來保證資料一致性。

相關備份技術

通常一套完整的備份系統包含備份軟體、磁帶機/磁帶庫、和備份伺服器,具體的備份策略的制定、備份介質的管理以及一些擴充套件功能的實現,都是由備份軟體來最終完成的。在備份伺服器上安裝備份軟體的伺服器端,在應用伺服器端安裝備份軟體的客戶端代理,如果是資料庫應用還需要相應的資料庫介面程式,客戶端代理軟體和伺服器端軟體協調工作,按照預先制定的備份策略自動或手動的將資料備份到磁帶上。

LAN Free Backup顧名思義,就是指釋放網路資源的資料備份方式。在SAN架構中,LAN Free Backup的實現機制一般如圖所示


 

備份伺服器嚮應用伺服器傳送指令和資訊,指揮應用伺服器將資料直接從磁碟陣列中備份到磁帶庫中。在這個過程中,龐大的備份資料流沒有流經網路,為網路節約了寶貴的頻寬資源。在NAS架構中,情形十分類似,磁帶庫直接連線在NAS檔案伺服器上,備份伺服器透過NDMP協議,指揮NAS檔案伺服器將資料備份到磁帶庫中。細心觀察之下會發現,這兩種方式雖然都節約了網路資源,但卻增加了伺服器的工作負荷,缺點是價格非常昂貴,大多數備份軟體的LAN Free功能選項都需要使用者付出高昂的價格。

Serverless Backup技術是以全面的釋放網路和伺服器資源為目的的,技術核心就是在SAN的交換層實現資料的複製工作,這樣備份資料不僅無需經過網路,而且也不必經過應用伺服器的匯流排,完全的保證了網路和應用伺服器的高效執行。但是現實情況卻沒有這麼理想,Serverless Backup技術目前只能停留在紙面上,實際實施效果很差,完全不需要主機干預還不現實。

主流備份軟體

備份軟體廠商中頭把交椅當屬Veritas公司。這家公司經過近幾年的發展和併購,在備份軟體市場已經佔據了四成左右的份額。其備份產品主要是兩個系列——高階的NetBackup和低端的Backup Exec。其中NetBackup適用於中型和大型的儲存系統,可以廣泛的支援各種開放平臺。NetBackup還支援複雜的網路備份方式和LAN Free的資料備份,其技術先進性是業界共同認可的。

Backup Exec是原Seagate Soft公司的產品,在Windows平臺具有相當的普及率和認可度,微軟公司不僅在公司內部全面採用這款產品進行資料保護,還將其簡化版打包在Windows作業系統中,我們現在在Windows系統中使用的“備份”功能,就是OEMBackup Exec的簡化版。2000年初,Veritas收購了Seagate Soft之後,在原來的基礎上對這個產品進一步豐富和加強,現在,這款產品在低端市場的佔用率已經穩穩的佔據第一的位置。

Legato公司是備份領域內僅次於Veritas公司的主要廠商。作為專業的備份軟體廠商,Legato公司擁有著比Veritas公司更久的歷史,這使其具有了相當的競爭優勢,一些大型應用的產品中涉及到備份的部分都會率先考慮與Legato的介面問題。而且,像Oracle等一些資料庫應用乾脆內建整合了Legato公司的備份引擎。這些因素使得Legato公司成為了高階備份軟體領域中的一面旗幟。在高階市場這一領域,Legato公司與Veritas公司一樣具有極強的技術和市場實力,兩家公司在高階市場的爭奪一直難分伯仲。

Legato公司的備份軟體產品以NetWorker系列為主線,與NetBackup一樣,NetWorker也是適用於大型的複雜網路環境,具有各種先進的備份技術機制,廣泛的支援各種開放系統平臺。值得一提的是, NetWorker中的Cellestra技術第一個在產品上實現了Serverless Backup的思想。僅就備份技術的先進性而言,Legato公司是有實力可以挑戰任何強大對手的。

除了VeritasLegato這備份領域的兩大巨頭之外,IBM Tivoli也是重要角色之一。其Tivoli Storage Manager產品是高階備份產品中的有力競爭者。與VeritasNetBackupLegatoNetWorker相比,Tivoli Storage Manager更多的適用於IBM主機為主的系統平臺,但其強大的網路備份功能覺對可以勝任任何大規模的海量儲存系統的備份需要。

CA公司是軟體領域的一個巨無霸企業,雖然主要精力沒有放在儲存技術方面,但其原來的備份軟體ARCServe仍然在低端市場具有相當廣泛的影響力。近年來,隨著儲存市場的發展,CA公司重新調整策略,併購了一些備份軟體廠商,整合之後今年推出了新一代備份產品——BrightStor,這款產品的定位直指中高階市場,看來CA公司誓要在高階市場與VeritasLegato一決雌雄。

介質

備份裝置的生產廠家很多,每個廠家都有著較長的產品線,由於篇幅所限,我們不可能一一列舉。這裡主要介紹那些國際知名的、國內有影響力的帶機和帶庫原廠商及其主打產品。

目前,帶機正在朝快的資料傳輸速度和高的單盤磁帶儲存容量方向發展,具有主流驅動技術的帶機廠商包括QuantumExabyteSony等。

Quantum帶機在中檔產品中佔據了市場大部分份額,但其中很大一部分走了OEM的銷售渠道。其自動載入機SuperLoader可將多個備份目標集中到一個共享的自動系統中,降低處理成本,而基於磁碟(備份介質是磁碟)又具有磁帶海量特性的近線備份裝置DX30可顯著縮短備份與恢復時間

Exabyte的磁帶驅動技術包括8mm MammothVXA技術,VXA定位低端的新的磁帶技術,它以包的格式讀寫資料,並可對磁帶上的資料記錄區進行無空隙掃描,具有高質量、高可靠性、低成本等效能特點其中VXA1帶機專為蘋果機設計的儲存方案;VXA2同樣具有較高的價效比,並具有12MB/s傳輸速率及160GB容量,與VXA1向下相容。

這裡我們有必要講一講Sony的基於AIT技術的帶機產品:AIT1AIT2AIT3,其中AIT3高效能和大容量的新儲存方案,容量(未壓縮)為100GB,速率為12MB/s,而且能夠與AIT1AIT2完全讀和寫逆向相容,並具有分層磁頭、創新性的磁帶記憶體儲器(MIC) 驅動器介面系統等多項專利技術,提高磁軌密度和儲存速度。

磁帶庫廠商相對品牌較多,使用者的選擇空間也更大一些。目前主流的磁帶庫廠商主要有STKQuantumExabyteIBM等。

在帶庫廠商中,市場份額最大的當屬美國儲存技術公司(StorageTekSTK)。STK目前最主要的產品線是L系列,包括L20L40L80L180L700L5500,從最小20磁帶槽位到最大5500磁帶槽位。在其入門級產品上,支援LTODLTSuperDLT等開放技術,只有在高階產品上才同時支援其自身擁有的98409940驅動技術。

Quantum擁有DLTSuperDLT技術,其使用者基礎和發展前景都很好。其P系列的主打產品P4000P7000分別可以支援幾百槽位和十幾個驅動器,適合於企業級使用者;M系列是模組化的產品,可根據使用者系統需求的增長靈活擴充套件帶庫的容量和效能,M1500可從20槽位擴充套件到200槽位,M2500則可從100槽位擴充套件到300槽位,非常適合於那些快速發展的中小企業。美中不足的是,ATL對超大容量的解決方案不是非常理想,在這一部分市場上的競爭力較弱。

8mm安百特(Exabyte)公司的獨立技術,具有速度快、容量大、可靠性高、價廉、體積小等特點,主要用於帶庫,其8mm帶庫智慧機械臂系統可任意存取磁帶,採用模組化設計,產品線全,VXA自動化/驅動器產品系列AutoPak230/115/110VXA-1/1Mammoth Tape自動化/驅動器產品系列X200/80/430M/215M/EZ17M2/Mammoth/Eliant 820容量從單盤(非壓縮)33GB整庫12TB,涵蓋由低到高的使用者市場,可實現無人值守自動資料儲存管理,用於伺服器備份、網路備份、自動歸檔、分級儲存管理及圖形圖等領域。

IBM,眾所周知,生產和銷售所有IT類產品,當然也包括帶庫產品。IBM的帶庫和帶機產品大體可分2個系列:用於IBM環境的和用於開放環境的。如IBM34943575等帶庫只支援其專用的驅動器,開放性差,雖然這些帶庫產品也支援HPSUN等主流伺服器平臺,但實際上幾乎只用在IBM環境中。隨著SAN技術的普及,追求開放性和互聯性成為儲存行業的潮流。結合LTO驅動技術的投產,IBM為其開放儲存系統解決方案推出了新的帶庫系列——35833584

備份技術新趨勢

D2D2TDisk to Disk toTape的縮寫,即資料備份從磁碟陣列到磁碟庫到磁帶的過程。傳統的磁帶

備份總是會帶給使用者以下苦惱:(圖2

u 備份速度慢,備份視窗冗長

u 備份的根本目的在於恢復,而磁帶的恢復速度很慢,對於TB級的資料恢復等待時間過長

u 磁帶介質受灰塵、溫度、溼度影響很大,難以保證已經離線儲存的磁帶在需要的時候可以正常工作

u 磁帶庫的機械手等物理裝置的故障率和磨損率相對電子元件較高

相信長期從事磁帶備份工作的管理員(尤其是大資料量關鍵應用的磁帶備份)對以上幾點都會深有感觸,尤其是當線上資料受到破壞,需要依靠磁帶備份來恢復正常生產的時候,大家都會為能否順利恢復資料捏一把汗。

有什麼辦法可以解決磁帶備份固有的劣勢呢?隨著磁碟容量的增長價格的下降,使用磁碟備份作為磁帶備份的補充甚至替代都成為可能,當然磁帶體積小,便於歸檔等特點是磁碟裝置不具備的,因此D2D2T即磁碟到磁碟到磁帶備份方式有效地中和了磁碟備份和磁帶備份的優點,線上資料儲存在高速磁碟陣列,備份資料首先儲存在價效比較高的SATA磁碟陣列中,然後定期將磁碟備份的資料儲存到磁帶上,這樣既縮短了備份視窗又增強了資料恢復的可靠性

 


 

複製

資料複製(Replication)是指利用複製軟體(如EMCSRDFH3C同步非同步映象等)把資料從一個磁碟複製到另一個磁碟,生成一個資料副本。這個資料副本是資料處理系統直接可以訪問的,不需要進行任何的資料恢復操作,這一點是複製與D2D備份的最大區別。

同步映象:應用於最高等級的容災方案(RPO等於0)中,需要關閉主機Cache來保證資料一致性。對於連線生產中心和災備中心的鏈路頻寬和QoS要求很高,一般採用光纖直連、波分裝置來保證,方案部署成本很高。

非同步映象:應用於較高階別的容災方案(RPO接近於0)中,無法有效保證資料一致性(關閉主機中的Cache和快照都不適合)。但對於連線生產中心和災備中心的鏈路頻寬和QoS要求一般,理論上頻寬只要達到“日新增資料量/24×3600×8)”即可。

增量複製:應用於較高階別的容災方案(RPO小於1小時)中,可以結合快照技術有效保證資料一致性。對於連線生產中心和災備中心的鏈路頻寬和QoS要求一般,理論上頻寬只要達到“資料增量/複製間隔”即可。

 

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29337971/viewspace-1073240/,如需轉載,請註明出處,否則將追究法律責任。

相關文章