讀資料保護:工作負載的可恢復性09磁碟備份方案

躺柒發表於2024-12-10

1. 用磁碟給磁帶機做快取

1.1. 對於雲端來說,並沒有D2D2T(Disk-to-Disk-to-Tape,從磁碟到磁碟再到磁帶)之類的說法

1.2. 大多數備份都是增量備份

1.3. 每秒鐘只會產生幾個到幾十個MB的資料,然而磁帶機所要求的速度則是每秒鐘幾百個MB,它們至少要達到這樣的速度才能順暢地執行

  • 1.3.1. 如果磁帶機的理想速度是每秒700MB,而你的備份流程每秒只能產生10MB的資料,那麼磁帶機與備份流程都會出狀況

1.4. 沒人關心你能不能備份,他們只看你能不能從中恢復資料

2. 備份系統中使用磁碟

2.1. 把一些磁碟放在磁帶櫃的前端,讓它充當磁帶機的快取

  • 2.1.1. 根據每晚所能產生的最大備份量來購買足夠多的磁碟

  • 2.1.2. 由於這些磁碟只是用來給磁帶機做快取的,因此最壞的情況只不過就是由於磁碟受損而丟失昨天晚上所做的那個備份

2.2. SATA、SAS與SSD的效能與可靠程度各不相同,SAS比SATA好,SSD比SAS好

2.3. 一定要考慮到是否需要做即時恢復,也就是說,你需不需要直接把備份掛載成虛擬機器

2.4. 如果要做即時恢復,那麼或許可以考慮多花一些錢,購買SAS或SSD來給磁帶機做快取

2.5. 標準的磁碟陣列應該比目標去重裝置便宜

  • 2.5.1. 不需要購買目標去重系統的

  • 2.5.2. 不會產生與使用目標去重系統有關的一些開銷

  • 2.5.3. 只是用磁碟暫時存放一些資料,讓它們能夠高速地發給磁帶機而已

  • 2.5.4. 每個備份流程都可以按照各自的速度把資料寫入磁碟陣列,而不會影響到其他的備份流程

2.6. 把所有的備份都做完之後,將它們複製到兩套磁帶裡面,一套保留在主站的磁帶櫃中,另一套轉移到別處

2.7. 最後一步就是要在新做的備份即將進入磁碟之前,讓磁碟中最舊的那個備份過期(也就是將其刪掉)​

  • 2.7.1. 儘量讓每個備份都在磁碟裡待得久一些,因為其中的某個備份或許會在恢復資料的過程中用到

  • 2.7.2. 良好的備份系統應該能夠自動執行這個讓備份過期的處理,它們會在你正要製作今天晚上的這個備份時,把最老的那個備份刪掉

2.8. 用磁碟做備份緩衝(disk staging),能夠解決備份資料的傳入速度與磁帶機的速度不一致的問題

  • 2.8.1. 恢復資料並沒有太大幫助,除非你的磁碟能夠容納一個完全備份以及根據這個完全備份所製作的一系列增量備份

  • 2.8.2. 磁碟快取的主要優勢並不在於它能幫我們更順利地恢復資料,而在於它能夠讓我們用較低的成本,輕鬆地實現出一種能夠將資料順利寫入磁帶的機制

  • 2.8.3. 讓我們能夠沿用目前的磁帶櫃系統與備份軟體,我們只需要購置幾塊價格相對低廉的磁碟,就可以讓磁帶櫃與備份軟體對接得更加順暢

3. D2D2T

3.1. D2D2T(Disk-to-Disk-to-Tape,從(有待保護的系統的)磁碟到(備份系統的)磁碟再到(磁帶櫃裡面的)磁帶)​

3.2. 所購買的磁碟不是用來暫時儲存一個晚上的備份量,而是用來正式保留備份資料,這意味著你可以使用去重技術,讓磁碟所要儲存的資料少一些,這樣就能夠少買幾塊磁碟

3.3. 所購置的磁碟至少要能夠儲存一個備份週期裡的資料量(也就是一個完全備份與一系列基於這個完全備份所製作的增量備份)​

3.4. 應該把所有的備份先傳送到儲存去重資料的磁碟,然後再從磁碟複製到磁帶

  • 3.4.1. 儲存去重資料的磁碟,就是你在執行恢復時首選的資料來源

  • 3.4.2. 只有在無法透過該磁碟恢復資料時,才考慮從磁帶裡面恢復

  • 3.4.3. 磁帶只用來儲存離站的備份副本,這些副本在磁帶上存留的時間可能比在磁碟上更長

  • 3.4.4. 只會製作一份磁帶形式的副本,並將其存放到別處

  • 3.4.5. 副本只用來應急,大家都不想遇到真正需要使用它的情況,但萬一遇到了,它還是管用的

3.5. 跟這個方案相搭配的去重技術,通常是目標去重技術

  • 3.5.1. 在只能購買一個去重裝置的前提下,還是使用目標去重比較方便

3.6. 使用源端去重時必須注意一個問題,就是某些系統可能會把已經去重的資料直接複製到磁帶裡面

3.7. 將去重資料存放在磁帶上,意味著恢復一份檔案可能要用到好幾盤磁帶,因為必須把分散在那些磁帶裡的資料結合起來才能得到完整的檔案

  • 3.7.1. 磁帶比較便宜,我們不值得為了節省磁帶而把經過去重處理的資料儲存到上面,那樣會給恢復工作造成很大困難,你必須先把這些資料所缺失的內容填補回來,然後才能恢復

  • 3.7.2. 需要用磁帶做恢復,通常意味著已經無法用其他方式來做恢復了,在這種情況下如果還要先把缺失的資料填補回來,那會更加忙亂

4. D2D2D

4.1. 可以徹底不用磁帶,而是完全採用磁碟來構建備份與恢復系統,這叫作D2D2D(Disk-to-Disk-to-Disk,從(有待保護的系統的)磁碟到(備份系統的)磁碟再到(位於別處的另一套)磁碟)​

4.2. 需要採用某種去重技術給備份去重,並把它儲存到磁碟系統上,然後,你需要將磁碟系統裡儲存的這些已經去重的備份複製到另一個磁碟系統,這次複製所涉及的去重技術,與剛開始備份時所採用的去重技術,應該是同一個廠家提供的

4.3. 如果使用目標去重系統,那麼這個複製備份資料的過程可以由去重裝置來做,也可以由備份軟體來做

4.4. 不需要在備份流程裡專門對這個複製的過程做配置或管理,你只需要安排兩個裝置,並讓其中一個把備份複製到另一個上面

4.5. 不需要藉助某個服務提供商,就可以製作出在場備份與離場備份

4.6. 讓裝置來管理這個複製備份資料的過程,其壞處在於:備份軟體並不知道這個備份還有一個副本儲存在別處

  • 4.6.1. 讓裝置來管理複製過程,還意味著這個過程對備份軟體來說是“不可見的”,

  • 4.6.2. 將去重之後的備份照原樣複製過去,假如它不清楚這一點,那麼有可能會先把備份裡缺失的內容填補回來,然後再複製

  • 4.6.3. 源端去重,那就無須擔心這問題了,這也是源端去重的另一項優勢

  • 4.6.3.1. 備份軟體清楚這些資料是已經去重的備份資料,只需要直接複製到別處就好,不需要先將其中缺失的內容填補回來

4.7. 讓備份軟體來管理這個複製備份資料的過程,還有一個好處就是可以針對不同的裝置指定不同的保留期

5. D2C

5.1. D2C(Direct-to-Cloud,直接到雲)​,這種方案需要配合源端去重技術

5.2. 所有的備份都放在備份客戶端去重,然後把其中互不重複的chunk直接傳送到雲端

5.3. 使用源端去重意味著你可以在任何地方做備份,而不像採用目標去重,還必須在那個地方安設一個硬體才行

5.4. 最大缺陷在於,如何處理首次備份的資料以及那些資料量比較大的恢復工作

5.5. 如何處理第一次備份,這種備份也稱為initial seed(初始種子)

  • 5.5.1. 對於源端去重來說,增量備份所產生的資料量通常還不到有待備份的那個資料集的百分之一,因此,向雲端傳輸這種日常的增量備份對頻寬並沒有多高的要求

  • 5.5.2. 第一次備份必須把所有的東西都備份下來,因此按照你們目前的網速來說,可能要花好長時間才能把資料傳過去

  • 5.5.3. 許多D2C的備份產品與服務,都支援透過物流來傳輸首次備份的資料

  • 5.5.3.1. 可以把這次備份的資料放在一個便攜裝置裡,寄給雲平臺的提供商

5.6. 雲端做DR(災難恢復)

6. D2D2C

6.1. 一種只需要使用磁碟的方案,叫作D2D2C(Disk-to-Disk-to-Cloud,從磁碟到磁碟再到雲)​,它是先把資料備份到本組織自己的磁碟系統裡面,然後再將其中的某些或全部備份儲存到雲端

6.2. D2D2C跟D2C之間的區別在於,雲端僅是用來存放備份副本或舊備份的次要場所,放在本組織裡面的這個備份,才是首要的備份

6.3. D2D2C方案通常會由那些傳統的備份廠商提供,他們主要是把經過去重的備份資料複製到客戶自己的磁碟系統裡面,雲端僅是儲存應急副本的地方

  • 6.3.1. 把本來應該放在別處的備份副本放在了雲端而已

6.4. 通常會把備份複製到物件儲存系統(例如S3)​,而且通常會把其中已經刪掉的重複內容填補回來

6.5. 如果你想把備份資料放在本組織自己的系統裡,以便將來能夠快速恢復資料,而把雲端只當成能夠儲存另一套備份且開銷比較低的地方(也就是說,你並不想從雲端做災難恢復)​,那麼將備份複製到物件儲存系統中就是比較合適的做法

相關文章