RDB 和 AOF 持久化的原理是什麼?我應該用哪一個?它們的優缺點?

搜雲庫技術團隊發表於2019-03-05

Redis 提供了 RDB 和 AOF 兩種持久化方案:

RDB:生成指定時間間隔內的 Redis 記憶體中資料快照,是一個二進位制檔案 dumpr.rdb

AOF:記錄 Redis 除了查詢以外的所有寫命令,並在Redis 服務啟動時,通過重新執行這些命令來還原資料。

RDB 持久化

預設 Redis 會以 RDB 快照的形式將一段時間內的資料持久化到硬碟,儲存成一個 dumpr.rdb 二進位制 檔案。

工作原理簡單介紹一下

當 Redis 需要做持久化時,Redis 會 fork 一個子程式,子程式將資料寫到磁碟上一個臨時 RDB 檔案中。當子程式完成寫臨時檔案後,將原來的 RDB 替換掉,這樣的好處就是可以 copy-on-write

當然我們也可以手動執行 save 或者 bgsave(非同步)生成 RDB 檔案。

redis.conf 預設配置

save 900  1
save 300  10
save 60  10000
複製程式碼
  • 900秒之內,如果超過1個key被修改,則發起快照儲存;
  • 300秒之內,如果超過10個key被修改,則發起快照儲存;
  • 60秒之內,如果1萬個key被修改,則發起快照儲存;

RDB 快照命令

在預設情況下, Redis 將資料庫快照儲存在名字為 dump.rdb 的二進位制檔案中。

你可以對 Redis 進行設定, 讓它在“ N 秒內資料集至少有 M 個改動”這一條件被滿足時, 自動儲存一次資料集。

你也可以通過呼叫 SAVE 或者 BGSAVE , 手動讓 Redis 進行資料集儲存操作。

比如說, 以下設定會讓 Redis 在滿足“ 60 秒內有至少有 1000 個鍵被改動”這一條件時, 自動儲存一次資料集:

save 60 1000
複製程式碼

這種持久化方式被稱為快照(snapshot)。

RDB 建立原理

當 Redis 需要儲存 dump.rdb 檔案時, 伺服器執行以下操作:

  • Redis 呼叫 fork() ,同時擁有父程式和子程式。
  • 子程式將資料集寫入到一個臨時 RDB 檔案中。
  • 當子程式完成對新 RDB 檔案的寫入時,Redis 用新 RDB 檔案替換原來的 RDB 檔案,並刪除舊的 RDB 檔案。

這種工作方式使得 Redis 可以從寫時複製(copy-on-write)機制中獲益。

RDB 的優點

RDB 是一個比較緊湊的檔案,它儲存了 Redis 在某個時間點的資料,這種資料比較適合做備份和用於災難恢復。

比如說,你可以在最近的 24 小時內,每小時備份一次 RDB 檔案,並且在每個月的每一天,也備份一個 RDB 檔案。 這樣的話,即使遇上問題,也可以隨時將資料集還原到不同的版本。

RDB 的缺點

如果你需要儘量避免在伺服器故障時丟失資料,那麼 RDB 不適合你。 雖然 Redis 允許你設定不同的儲存點來控制儲存 RDB 檔案的頻率, 但是, 因為 RDB 檔案需要儲存整個資料集的狀態, 所以它並不是一個輕鬆的操作。 因此你可能會至少 5 分鐘才儲存一次 RDB 檔案。 在這種情況下, 一旦發生故障停機, 你就可能會丟失好幾分鐘的資料。

AOF 持久化

使用 AOF 做持久化,每一個寫命令都通過 write 函式追加到 appendonly.aof 檔案中。

AOF 就可以做到全程持久化,只需要在配置檔案中開啟(預設是 no ),appendfsync yes 開啟 AOF 之後,Redis 每執行一個修改資料的命令,都會把它新增到 AOF 檔案中,當 Redis 重啟時,將會讀取 AOF 檔案進行“重放”以恢復到 Redis 關閉前的最後時刻。

AOF 的配置

你可以配置 Redis 多久才將資料 fsync 到磁碟一次。

redis.conf 預設配置

appendfsync yes
appendfsync always     #每次有資料修改發生時都會寫入AOF檔案。
appendfsync everysec   #每秒鐘同步一次,該策略為AOF的預設策略。
複製程式碼

有三個選項:

**1,每次有新命令追加到 AOF 檔案時就執行一次 fsync **:非常慢,也非常安全。 2,每秒 fsync 一次:足夠快(和使用 RDB 持久化差不多),並且在故障時只會丟失 1 秒鐘的資料。 3,從不 fsync :將資料交給作業系統來處理。更快,也更不安全的選擇。

推薦(並且也是預設)的措施為每秒 fsync 一次, 這種 fsync 策略可以兼顧速度和安全性。

AOF 建立原理

AOF 重寫和 RDB 建立快照一樣,都巧妙地利用了寫時複製機制。

以下是 AOF 重寫的執行步驟

Redis 執行 fork() ,現在同時擁有父程式和子程式。

子程式開始將新 AOF 檔案的內容寫入到臨時檔案。

對於所有新執行的寫入命令,父程式一邊將它們累積到一個記憶體快取中,一邊將這些改動追加到現有 AOF 檔案的末尾: 這樣即使在重寫的中途發生停機,現有的 AOF 檔案也還是安全的。

當子程式完成重寫工作時,它給父程式傳送一個訊號,父程式在接收到訊號之後,將記憶體快取中的所有資料追加到新 AOF 檔案的末尾。

搞定!現在 Redis 原子地用新檔案替換舊檔案,之後所有命令都會直接追加到新 AOF 檔案的末尾。

AOF 的優點

1,使用 AOF 做持久化,可以設定不同的 fsync 策略,比如無 fsync ,每秒鐘一次 fsync ,或者每次執行寫入命令時 fsync 。

AOF 的預設策略為每秒鐘 fsync 一次,在這種配置下,Redis 仍然可以保持良好的效能,並且就算髮生故障停機,也最多隻會丟失一秒鐘的資料。

fsync 會在後臺執行緒執行,所以主執行緒可以繼續努力地處理命令請求。

2,AOF 檔案是一個只進行追加操作的日誌檔案,不是生成新的之後替換掉那種,即使日誌因為某些原因而包含了未寫入完整的命令(比如寫入時磁碟已滿,寫入中途停機,等等), redis-check-aof 工具也可以輕易地修復這種問題。

3,Redis 可以在 AOF 檔案體積變得過大時,自動地在後臺對 AOF 進行重寫: 重寫後的新 AOF 檔案包含了恢復當前資料集所需的最小命令集合。

整個重寫操作是絕對安全的,因為 Redis 重寫是建立新 AOF 檔案,重寫的過程中會繼續將命令追加到現有舊的 AOF 檔案裡面,即使重寫過程中發生停機,現有舊的 AOF 檔案也不會丟失。 而一旦新 AOF 檔案建立完畢,Redis 就會從舊 AOF 檔案切換到新 AOF 檔案,並開始對新 AOF 檔案進行追加操作。

4,AOF 檔案有序地儲存了對資料庫執行的所有寫入操作, 這些寫入操作以 Redis 協議的格式儲存, 因此 AOF 檔案的內容非常容易被人讀懂, 對檔案進行分析(parse)也很輕鬆。 匯出(export) AOF 檔案也非常簡單: 舉個例子, 如果你不小心執行了 FLUSH ALL(清空整個 Redis 伺服器的資料(刪除所有資料庫的所有 key )。) 命令, 但只要 AOF 檔案未被重寫, 那麼只要停止伺服器, 移除 AOF 檔案末尾的 FLUSHALL 命令, 並重啟 Redis , 就可以將資料集恢復到 FLUSHALL 執行之前的狀態。

AOF 的缺點

對於相同的資料集來說,AOF 檔案的體積通常要大於 RDB 檔案的體積。

根據所使用的 fsync 策略,AOF 的速度可能會慢於 RDB。 在一般情況下, 每秒 fsync 的效能依然非常高, 而關閉 fsync 可以讓 AOF 的速度和 RDB 一樣快, 即使在高負荷之下也是如此。

不過在處理巨大的寫入載入時,RDB 可以提供更有保證的最大延遲時間(latency)。

RDB 和 AOF 二者的區別

RDB持久化是指在指定的時間間隔內將記憶體中的資料集快照寫入磁碟,實際操作過程是fork一個子程式,先將資料集寫入臨時檔案,寫入成功後,再替換之前的檔案,用二進位制壓縮儲存。

AOF持久化以日誌的形式記錄伺服器所處理的每一個寫、刪除操作,查詢操作不會記錄,以文字的方式追加記錄,可以開啟檔案看到詳細的操作記錄。

RDB 和 AOF 我應該用哪一個?

如果你非常關心你的資料,但仍然可以承受數分鐘以內的資料丟失,那麼你可以只使用 RDB 持久。

AOF 將 Redis 執行的每一條命令追加到磁碟中,處理巨大的寫入會降低 Redis 的效能,不知道你是否可以接受。

資料庫備份和災難恢復:

定時生成 RDB 快照(snapshot)非常便於進行資料庫備份, 並且 RDB 恢復資料集的速度也要比 AOF 恢復的速度要快。

Redis 支援同時開啟 RDB 和 AOF,系統重啟後,Redis 會優先使用 AOF 來恢復資料,這樣丟失的資料會最少。

AOF BGREWRITEAOF 重寫

因為 AOF 的運作方式是不斷地將命令追加到檔案的末尾, 所以隨著寫入命令的不斷增加, AOF 檔案的體積也會變得越來越大。

舉個例子

如果你對一個計數器呼叫了 100 次 INCR , 那麼僅僅是為了儲存這個計數器的當前值, AOF 檔案就需要使用 100 條記錄(entry)

然而在實際上, 只使用一條 SET 命令已經足以儲存計數器的當前值了, 其餘 99 條記錄實際上都是多餘的。

為了處理這種情況, Redis 支援一種有趣的特性: 可以在不打斷服務客戶端的情況下, 對 AOF 檔案進行重建(rebuild)。

執行 BG REWRITE AOF 命令, Redis 將生成一個新的 AOF 檔案, 這個檔案包含重建當前資料集所需的最少命令。

Redis 2.2 需要自己手動執行 BGREWRITEAOF 命令; Redis 2.4 則可以自動觸發 AOF 重寫, 具體資訊請檢視 2.4 的示例配置檔案。

備份 Redis 資料

磁碟故障, 節點失效, 諸如此類的問題都可能讓你的資料消失不見, 不進行備份是非常危險的。

Redis 對於資料備份是非常友好的, 因為你可以在伺服器執行的時候對 RDB 檔案進行復制: RDB 檔案一旦被建立, 就不會進行任何修改。 當伺服器要建立一個新的 RDB 檔案時, 它先將檔案的內容儲存在一個臨時檔案裡面, 當臨時檔案寫入完畢時, 程式才使用 rename(2) 原子地用臨時檔案替換原來的 RDB 檔案。

這也就是說, 無論何時, 複製 RDB 檔案都是絕對安全的。

以下是我們的建議

1,建立一個定期任務(cron job), 每小時將一個 RDB 檔案備份到一個資料夾, 並且每天將一個 RDB 檔案備份到另一個資料夾。 2,確保快照的備份都帶有相應的日期和時間資訊, 每次執行定期任務指令碼時, 使用 find 命令來刪除過期的快照: 比如說, 你可以保留最近 48 小時內的每小時快照, 還可以保留最近一兩個月的每日快照。 3,至少每天一次, 將 RDB 備份到你的資料中心之外, 或者至少是備份到你執行 Redis 伺服器的物理機器之外。

RDB 和 AOF 持久化的原理是什麼?我應該用哪一個?它們的優缺點?

相關文章