Linux 管理員手冊(8)--備份(轉)

gugu99發表於2007-08-10
Linux 管理員手冊(8)--備份(轉)[@more@]

  硬體不肯定是可靠的

  軟體肯定是不可靠的

  人不肯定是不可靠的

  而自然肯定是可靠的

  本張說明為什麼、如何、何時要做備份,及如何回存備份的東西。

  備份的重要

  資料是有價值的。重新產生它需要你花費時間和努力,並且要花費金錢或至少傷心和眼淚,有時甚至不可能重新產生,例如一些實驗結果。由於資料是一種投資,你必須保護它,並採取措施避免丟失。

  丟失資料一般有4個原因:硬體失敗、軟體曲線、人為因素或自然災害。 雖然現代硬體已經相當可靠,但仍可能自然損壞。儲存資料最決定性的硬體是硬碟,它依賴微小的磁區在充滿電噪聲的世界上儲存資料。現代軟體依然不可靠,一個真正可靠的程式是理想、罕見的,而不是規律。人更不可靠,他們很容易犯錯誤,甚至為某種目的惡意地破壞資料。自然可能不是邪惡的,但也可能造成破壞。一切的一切,希望什麼都正常、完美幾乎是不可能的。

  備份是保護資料投資的方法。有資料的多個複製,就不怕某個損壞(所需做的僅僅是從備份中恢復丟失的資料)。

  正確的備份是很重要的。正如物理世界中任何東西都與其他相關,備份也遲早會失效。好的備份確保有效,你不希望你的備份無效。 如果你的備份又壞了,這將雪上加霜,如果你只有一個備份,它可能根本是壞的,只留下你和硬碟中冒煙的灰燼。 或者當你恢復時,發現忘了備份一些重要的東西,比如15000個使用者站點的使用者資料庫。 Best of all, all your backups might be working perfectly, but the last known tape drive reading the kind of tapes you used was the one that now has a bucketful of water in it.

  When it comes to backups, paranoia is in the job description.

  選擇備份介質

  備份所需的最重要的決定是選擇備份介質。需要考慮成本、可靠性、速度、可得到、可用性。

  成本是很重要的,因為你的資料可能需要多個儲存、多個備份。便宜的介質可以用很多。

  可靠性是最重要的,因為壞的備份會雪上加霜。備份介質必須能儲存資料多年而不損壞。作為備份介質,使用方法影響可靠性。硬碟一般是很可靠的,但作為備份介質並非很可靠,如果它和備份源在同一計算機裡的話。

  速度通常不太重要,如果備份可以非互動地完成。備份花2個小時無所謂,無須監督,多長時間都沒有關係。另一方面,if the backup can't be done when the computer would otherwise be idle, 那麼速度也是個問題。

  可得到是明顯必要的,因為你無法使用不存在的備份介質。不太明顯的是要在將來還能得到這種介質,並且能在其他計算機上使用。否則災害之後,你可能無法恢復你的備份。

  可用性是決定備份週期的主要因素。備份越容易使用越好。備份介質不能難以使用。

  一般用軟盤和磁帶。軟盤很便宜,還算可靠,不太快,很容易得到,但資料量大時不容易使用。磁帶也很便宜,還算可靠,還算快,很容易得到,而且,依賴於磁帶的容量,使用很輕鬆。

  還有其他選擇。但通常可得性不好,但如果這不成問題,有時也不錯。例如,磁光碟同時具有軟盤(隨機存取,可以快速地恢復單個檔案)和磁帶(大容量)的優點.

  選擇備份工具

  備份有很多工具,傳統的UNIX備份工具是tar 、 cpio 和dump 。另外,還可以使用大量第三方軟體包(包括freeware和商業版)。備份介質的選擇可能影響工具的選擇。

  tar 和cpio 類似,從備份來看二者基本等效。都能將檔案存到磁帶並取出檔案。都能使用幾乎所有介質,因為核心裝置驅動處理低階裝置操作,對使用者級程式看來所有裝置都差不多。有寫Unix版本的tar 和cpio 對不是普通檔案可能有問題(符號連線、裝置檔案、極長路徑名的檔案等等),但Linux的能正確處理所有檔案。

  dump 不同,它直接讀檔案系統,而不透過檔案系統。 It is also written specifically for backups; tar 和cpio are really for archiving files, although they work for backups as well.

  直接讀檔案系統有些優點,它可能不考慮time stamps備份所有檔案;對於tar 和cpio ,必須先將檔案系統只讀安裝。直接讀檔案系統更有效,如果所有東西都要備份,因為它使磁頭移動最少。它的主要缺點是每個檔案系統種類需要特定的備份程式, Linux的dump 程式只理解ext2檔案系統。

  dump 也直接支援備份級(下面討論);對tar 和cpio ,這必須用其他工具實現。

  第三方備份工具的比較超出了本書的範圍。Linux Software Map列出了許多freeware的。

  簡單備份

  一個簡單的備份方案是一次備份所有東西,然後備份上次備份後改變的所有東西。第一個備份叫全備份full backup,後來的叫i增量備份ncremental backups。全備份比增量備份費時費力,因為有更多的東西寫到磁帶,而且全備份可能不能放如一盤磁帶中(更別說軟盤了)。回存增量備份比全備份可能要花更多的時間。備份可以這樣最佳化,就是自上次全備份以後,總用增量備份儲存所有改過的檔案。這樣,備份可能需要多一些的工作,但你只需回存一個全備份和一個增量備份。

  如果有6盤磁帶想每天備份,可以用磁帶1做第一個全備份(比如在星期五),用磁帶2-5做增量備份(週一到週四)。然後用磁帶6做新的全備份(第二個週五),然後再用磁帶2-5做增量備份。在做完新的全備份之前不要覆蓋舊的全備份(磁帶1),一面在做全備份的時候出現問題。有了新的全備份磁帶6以後,最好在另一個地方儲存磁帶1,這樣如果有一個全備份磁帶在火災中損失了,還能有一個。當再做下一個全備份是,再用磁帶1而儲存磁帶6。

  如果你有多於6盤磁帶,可以用多的做全備份。每次做全備份,應該使用最老的磁帶。這樣你會有最近幾周的全備份,對你如果想找到一個現在已經刪除的就檔案,或一個檔案的舊版本很有用。

  用tar備份

  一個全備份可以很容易地用tar 實現:

  # tar -create -file /dev/ftape /usr/src

tar: Removing leading / from absolute path names in the archive

#

  上面的例子使用GNU版本的tar 及其長選項名。傳統版本的tar 只理解單字元選項。 GNU版還能處理一盤磁帶或一張磁碟不能容納的備份,及很長的路徑名;這不是所有傳統的版本能作到的。 (Linux只使用GNU tar 。)

  如果你的備份一盤磁帶不能容納,你需要使用-multi-volume (-M)選項:

  # tar -cMf /dev/fd0H1440 /usr/src

tar: Removing leading / from absolute path names in the archive

Prepare volume #2 for /dev/fd0H1440 and hit return:

#

  注意開始備份前要格式化所有軟盤,或在tar 需要新軟盤時用另一個虛擬控制檯或虛擬終端格式化它。

  備份完後,應該檢查它是否完好,用-compare (-d)選項:

  # tar -compare -verbose -f /dev/ftape

usr/src/

usr/src/linux

usr/src/linux-1.2.10-includes/

....

#

  失敗的備份檢查意味著如果你丟失了原始資料,備份也無法恢復。

  增量備份可用帶-newer (-N)選項的tar 來實現:

  # tar -create -newer '8 Sep 1995' -file /dev/ftape /usr/src -verbose

tar: Removing leading / from absolute path names in the archive

usr/src/

usr/src/linux-1.2.10-includes/

usr/src/linux-1.2.10-includes/include/

usr/src/linux-1.2.10-includes/include/linux/

usr/src/linux-1.2.10-includes/include/linux/modules/

usr/src/linux-1.2.10-includes/include/asm-generic/

usr/src/linux-1.2.10-includes/include/asm-i386/

usr/src/linux-1.2.10-includes/include/asm-mips/

usr/src/linux-1.2.10-includes/include/asm-alpha/

usr/src/linux-1.2.10-includes/include/asm-m68k/

usr/src/linux-1.2.10-includes/include/asm-sparc/

usr/src/patch-1.2.11.gz

#

  不幸的是,tar 不能知道一個檔案的i節點資訊變化,例如,檔案的許可權位變化,或檔名變化。這可用find 命令和比較當前檔案系統狀態和先前備份的檔案列表。用於此的Scripts和程式可以在Linux FTP站點上找到。

  用tar回存

  tar 的-extract (-x)選項展開檔案:

  # tar -extract -same-permissions -verbose -file /dev/fd0H1440

usr/src/

usr/src/linux

usr/src/linux-1.2.10-includes/

usr/src/linux-1.2.10-includes/include/

usr/src/linux-1.2.10-includes/include/linux/

usr/src/linux-1.2.10-includes/include/linux/hdreg.h

usr/src/linux-1.2.10-includes/include/linux/kernel.h

...

#

  也可以用命令列只展開特定的檔案和目錄(及其中的檔案和子目錄):

  # tar xpvf /dev/fd0H1440 usr/src/linux-1.2.10-includes/include/linux/hdreg.h

usr/src/linux-1.2.10-includes/include/linux/hdreg.h

#

  用-list (-t)選項看一個備份卷中有什麼檔案:

  # tar -list -file /dev/fd0H1440

usr/src/

usr/src/linux

usr/src/linux-1.2.10-includes/

usr/src/linux-1.2.10-includes/include/

usr/src/linux-1.2.10-includes/include/linux/

usr/src/linux-1.2.10-includes/include/linux/hdreg.h

usr/src/linux-1.2.10-includes/include/linux/kernel.h

...

#

  注意tar 永遠是順序讀一個備份卷,因此大的卷會很慢。使用磁帶機或其他順序介質時不可能使用隨機存取資料庫技術。

  tar 不處理刪除檔案屬性。如果你需要從一個全備份和一個增量備份恢復一個檔案系統,並且2個備份之間你刪除了一個檔案,當你恢復完後,這個檔案又存在了。如果這個檔案包含應該刪除的敏感資料,這是個大問題。

  多級備份

  上面的章節概述了簡單備份的方法,對個人使用或小的站點使用。對於多數重負荷的使用,多級備份更適用。

  簡單備份有2個備份級:全備份和增量備份。通常可以有任意數量的備份級。全備份是0級,不同級別的增量備份是1、2、3...級,每個增量備份級備份同一或上一級別的上次備份後改變的所有東西。

  這樣多的目的是更便宜地允許更長的備份歷史backup history。在前面的例子中,備份歷史追溯到上一個全備份。可以增多磁帶來擴充套件備份歷史,但每個新磁帶擴充套件一週,這樣可能太貴。更長的備份歷史是有用的,因為刪除或損壞的檔案可能長時間未被發現。即使不是一個檔案的最新版本,也比沒有好。

  多級備份可以更便宜地擴充套件備份歷史。例如,如果你有10盤磁帶,可用磁帶1和2做月備份(每月的第一個週五),磁帶3-6做周備份(其他週五,因為每月最多可能有5個週五,因此需要4盤磁帶),磁帶7-10做日備份(週一到週四)。只增加了4盤磁帶,就將2周的備份歷史擴充套件到2個月。誠然,我們無法恢復這2個月中每個檔案的所有版本,但這樣恢復的經常是足夠好了。

  備份級可使檔案系統恢復用最少的時間。如果你有許多隻是單調增長級別數的增量備份,要恢復整個檔案系統,你需要回存所有備份。而如果級別數不是單調增長,可以減少備份和回存的數目。

  為了將回存需要的磁帶資料減至最小,可以用小的級別做每個增量磁帶。然而,這樣做每個增量備份的時間會增加(每個備份複製了上次全備份後改變的所有東西)。一個好的方案建議在dump man頁中給出,並在表 9.2中說明。 Use the following succession of backup levels: 3, 2, 5, 4, 7, 6, 9, 8, 9... 這使備份和回存所用的時間保持較少。 The most you have to backup is two day's worth of work. 恢復所需磁帶數有賴於全備份的間隔,但它比簡單的方案少。

  一個好的方案降低了工作量,並能追尋更多的東西。You must decide if it is worth it.

  dump 對備份級有內建的支援。而tar 和cpio 則必須用shell scripts實現。

  備份什麼?

  你可能想盡多備份。主要的例外是容易重安裝的軟體, 但即使是它們,也有配置檔案,對備份很重要,以免對這些軟體全部重新配置。另一個主要的例外是/proc 檔案系統,因為他們只包含通常由核心自動產生的資料,備份它們絕不是個好主意。特別是/proc/kcore 檔案更是不必要,因為它只是你當前實體記憶體的映象,而且很大。

  Gray areas include the news spool, log files, and many other things in /var . 你必須決定重點考慮什麼。

  備份最明顯的是使用者檔案(/home )和系統配置檔案(/etc ,但還可能有散落在檔案系統其他地方的其他東西。

  壓縮備份

  備份佔用大量空間,要花費大量金錢。為了降低空間需求,備份可以壓縮。有幾種方法。有些程式內建支援壓縮。例如GNU tar 的-gzip (-z)選項,透過管道(pipe),在寫到備份介質前,先用 gzip 壓縮程式壓縮。

  不幸的是,壓縮備份可能導致問題。由於壓縮工作的原理,如果一個bit錯誤,可能導致所有其他壓縮資料不可用。有些備份程式內建錯誤校正,但沒有辦法處理大量的錯誤。就是說,如果用GNU tar 壓縮備份,一個單獨的錯誤回導致整個備份丟失。備份必須可靠,這樣的壓縮方法不好。

  還有一個方法是單獨壓縮每個檔案,這也回導致一個檔案的丟失,但不會影響其他檔案。丟失的檔案可能已經因為什麼原因損壞,因此這種情況比不使用壓縮差不了多少。 afio 程式(cpio 的一個變種)可以這樣。

  壓縮需要時間,which may make the backup program unable to write data fast enough for a tape drive. 這可以靠輸出緩衝來避免(如果備份程式足夠智慧,可以內建,否則可以透過其他程式), but even that might not work well enough. 這隻會在慢的計算機上是個問題。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/10748419/viewspace-939985/,如需轉載,請註明出處,否則將追究法律責任。

相關文章