一文看懂Redis的持久化原理

大愚Talk發表於2019-03-03

原文網址 : https://flycode.co/archives/266369

Redis持久化

Redis為持久化提供了兩種方式：

RDB：在指定的時間間隔能對你的資料進行快照儲存。
AOF：記錄每次對伺服器寫的操作,當伺服器重啟的時候會重新執行這些命令來恢復原始的資料。

本文將通過下面內容的介紹，希望能夠讓大家更全面、清晰的認識這兩種持久化方式，同時理解這種儲存資料的思路，應用於自己的系統設計中。

持久化的配置
RDB與AOF持久化的工作原理
如何從持久化中恢復資料
關於效能與實踐建議

持久化的配置

為了使用持久化的功能，我們需要先知道該如何開啟持久化的功能。

RDB的持久化配置

# 時間策略
save 900 1
save 300 10
save 60 10000

# 檔名稱
dbfilename dump.rdb

# 檔案儲存路徑
dir /home/work/app/redis/data/

# 如果持久化出錯，主程式是否停止寫入
stop-writes-on-bgsave-error yes

# 是否壓縮
rdbcompression yes

# 匯入時是否檢查
rdbchecksum yes
複製程式碼

配置其實非常簡單，這裡說一下持久化的時間策略具體是什麼意思。

save 900 1 表示900s內如果有1條是寫入命令，就觸發產生一次快照，可以理解為就進行一次備份
save 300 10 表示300s內有10條寫入，就產生快照

下面的類似，那麼為什麼需要配置這麼多條規則呢？因為Redis每個時段的讀寫請求肯定不是均衡的，為了平衡效能與資料安全，我們可以自由定製什麼情況下觸發備份。所以這裡就是根據自身Redis寫入情況來進行合理配置。

stop-writes-on-bgsave-error yes 這個配置也是非常重要的一項配置，這是當備份程式出錯時，主程式就停止接受新的寫入操作，是為了保護持久化的資料一致性問題。如果自己的業務有完善的監控系統，可以禁止此項配置， 否則請開啟。

關於壓縮的配置 rdbcompression yes ，建議沒有必要開啟，畢竟Redis本身就屬於CPU密集型伺服器，再開啟壓縮會帶來更多的CPU消耗，相比硬碟成本，CPU更值錢。

當然如果你想要禁用RDB配置，也是非常容易的，只需要在save的最後一行寫上：save ""

AOF的配置

# 是否開啟aof
appendonly yes

# 檔名稱
appendfilename "appendonly.aof"

# 同步方式
appendfsync everysec

# aof重寫期間是否同步
no-appendfsync-on-rewrite no

# 重寫觸發配置
auto-aof-rewrite-percentage 100
auto-aof-rewrite-min-size 64mb

# 載入aof時如果有錯如何處理
aof-load-truncated yes

# 檔案重寫策略
aof-rewrite-incremental-fsync yes
複製程式碼

還是重點解釋一些關鍵的配置：

appendfsync everysec 它其實有三種模式:

always：把每個寫命令都立即同步到aof，很慢，但是很安全
everysec：每秒同步一次，是折中方案
no：redis不處理交給OS來處理，非常快，但是也最不安全

一般情況下都採用 everysec 配置，這樣可以兼顧速度與安全，最多損失1s的資料。

aof-load-truncated yes 如果該配置啟用，在載入時發現aof尾部不正確是，會向客戶端寫入一個log，但是會繼續執行，如果設定為 no ，發現錯誤就會停止，必須修復後才能重新載入。

工作原理

關於原理部分，我們主要來看RDB與AOF是如何完成持久化的，他們的過程是如何。

在介紹原理之前先說下Redis內部的定時任務機制，定時任務執行的頻率可以在配置檔案中通過 hz 10 來設定（這個配置表示1s內執行10次，也就是每100ms觸發一次定時任務）。該值最大能夠設定為：500，但是不建議超過：100，因為值越大說明執行頻率越頻繁越高，這會帶來CPU的更多消耗，從而影響主程式讀寫效能。

定時任務使用的是Redis自己實現的 TimeEvent，它會定時去呼叫一些命令完成定時任務，這些任務可能會阻塞主程式導致Redis效能下降。因此我們在配置Redis時，一定要整體考慮一些會觸發定時任務的配置，根據實際情況進行調整。

RDB的原理

在Redis中RDB持久化的觸發分為兩種：自己手動觸發與Redis定時觸發。

針對RDB方式的持久化，手動觸發可以使用：

save：會阻塞當前Redis伺服器，直到持久化完成，線上應該禁止使用。
bgsave：該觸發方式會fork一個子程式，由子程式負責持久化過程，因此阻塞只會發生在fork子程式的時候。

而自動觸發的場景主要是有以下幾點：

根據我們的 save m n 配置規則自動觸發；
從節點全量複製時，主節點傳送rdb檔案給從節點完成複製操作，主節點會觸發 bgsave；
執行 debug reload 時；
執行 shutdown時，如果沒有開啟aof，也會觸發。

由於 save 基本不會被使用到，我們重點看看 bgsave 這個命令是如何完成RDB的持久化的。

這裡注意的是 fork 操作會阻塞，導致Redis讀寫效能下降。我們可以控制單個Redis例項的最大記憶體，來儘可能降低Redis在fork時的事件消耗。以及上面提到的自動觸發的頻率減少fork次數，或者使用手動觸發，根據自己的機制來完成持久化。

AOF的原理

AOF的整個流程大體來看可以分為兩步，一步是命令的實時寫入（如果是 appendfsync everysec 配置，會有1s損耗），第二步是對aof檔案的重寫。

對於增量追加到檔案這一步主要的流程是：命令寫入=》追加到aof_buf =》同步到aof磁碟。那麼這裡為什麼要先寫入buf在同步到磁碟呢？如果實時寫入磁碟會帶來非常高的磁碟IO，影響整體效能。

aof重寫是為了減少aof檔案的大小，可以手動或者自動觸發，關於自動觸發的規則請看上面配置部分。fork的操作也是發生在重寫這一步，也是這裡會對主程式產生阻塞。

手動觸發： bgrewriteaof，自動觸發 就是根據配置規則來觸發，當然自動觸發的整體時間還跟Redis的定時任務頻率有關係。

下面來看看重寫的一個流程圖：

對於上圖有四個關鍵點補充一下：

在重寫期間，由於主程式依然在響應命令，為了保證最終備份的完整性；因此它依然會寫入舊的AOF file中，如果重寫失敗，能夠保證資料不丟失。
為了把重寫期間響應的寫入資訊也寫入到新的檔案中，因此也會為子程式保留一個buf，防止新寫的file丟失資料。
重寫是直接把當前記憶體的資料生成對應命令，並不需要讀取老的AOF檔案進行分析、命令合併。
AOF檔案直接採用的文字協議，主要是相容性好、追加方便、可讀性高可認為修改修復。

不能是RDB還是AOF都是先寫入一個臨時檔案，然後通過 rename 完成檔案的替換工作。

從持久化中恢復資料

資料的備份、持久化做完了，我們如何從這些持久化檔案中恢復資料呢？如果一臺伺服器上有既有RDB檔案，又有AOF檔案，該載入誰呢？

其實想要從這些檔案中恢復資料，只需要重新啟動Redis即可。我們還是通過圖來了解這個流程：

啟動時會先檢查AOF檔案是否存在，如果不存在就嘗試載入RDB。那麼為什麼會優先載入AOF呢？因為AOF儲存的資料更完整，通過上面的分析我們知道AOF基本上最多損失1s的資料。

效能與實踐

通過上面的分析，我們都知道RDB的快照、AOF的重寫都需要fork，這是一個重量級操作，會對Redis造成阻塞。因此為了不影響Redis主程式響應，我們需要儘可能降低阻塞。

降低fork的頻率，比如可以手動來觸發RDB生成快照、與AOF重寫；
控制Redis最大使用記憶體，防止fork耗時過長；
使用更牛逼的硬體；
合理配置Linux的記憶體分配策略，避免因為實體記憶體不足導致fork失敗。

線上上我們到底該怎麼做？我提供一些自己的實踐經驗。

如果Redis中的資料並不是特別敏感或者可以通過其它方式重寫生成資料，可以關閉持久化，如果丟失資料可以通過其它途徑補回；
自己制定策略定期檢查Redis的情況，然後可以手動觸發備份、重寫資料；
單機如果部署多個例項，要防止多個機器同時執行持久化、重寫操作，防止出現記憶體、CPU、IO資源競爭，讓持久化變為序列；
可以加入主從機器，利用一臺從機器進行備份處理，其它機器正常響應客戶端的命令；
RDB持久化與AOF持久化可以同時存在，配合使用。

本文的內容主要是運維上的一些注意點，但我們開發者瞭解到這些知識，在某些時候有助於我們發現詭異的bug。接下來會介紹Redis的主從複製與叢集的知識。

公眾號：dayuTalk

一起看懂Redis兩種持久化方式的原理
2018-08-14
Redis持久化
Redis原理二：持久化
2018-09-04
Redis持久化
一文了解：Redis的AOF持久化
2019-08-12
Redis持久化
一文帶你深入瞭解 Redis 的持久化方式及其原理
2019-11-20
Redis持久化
Redis的持久化
2022-11-24
Redis持久化
Redis 的持久化
2021-05-09
Redis持久化
一文讓你明白Redis持久化(RDB、AOF)
2022-01-05
Redis持久化
一文深度揭祕Redis的磁碟持久化機制
2019-10-12
Redis持久化
redis持久化
2024-04-13
Redis持久化
Redis 持久化
2020-06-10
Redis持久化
[Redis]持久化
2024-07-06
Redis持久化
Redis - 持久化
2021-05-16
Redis持久化
Redis的持久化方案
2020-03-16
Redis持久化
Redis的持久化策略
2020-10-28
Redis持久化
Redis的持久化方式
2019-03-26
Redis持久化
搞懂Redis RDB和AOF持久化及工作原理
2019-04-13
Redis持久化
YC一文搞懂MySQL持久化和回滾的原理bmy
2022-03-01
MySql持久化
Redis資料持久化—RDB持久化與AOF持久化
2021-05-20
Redis持久化
Redis的持久化設計
2020-06-14
Redis持久化
redis的持久化機制
2024-09-11
Redis持久化
Redis的資料持久化
2022-12-20
Redis持久化
Redis：持久化篇
2019-04-09
Redis持久化
redis-持久化
2018-08-17
Redis持久化
redis 之持久化
2020-07-27
Redis持久化
Redis 七持久化
2020-11-14
Redis持久化
Redis 持久化方案
2020-03-31
Redis持久化
redis ——AOF持久化
2020-04-03
Redis持久化
redis 持久化策略
2024-10-17
Redis持久化
Redis 持久化（Persistence）
2021-02-12
Redis持久化
redis系列：RDB持久化與AOF持久化
2019-03-02
Redis持久化
redis之 Redis持久化配置
2018-10-07
Redis持久化
Redis（五）--- Redis的持久化RDB與AOF
2019-07-27
Redis持久化
高可用Redis(七)：Redis持久化
2021-09-09
Redis持久化
Redis持久化背後的故事
2019-07-23
Redis持久化
redis的兩種持久化方案
2019-05-13
Redis持久化
深入理解redis的持久化
2018-04-22
Redis持久化
redis快照--RDB持久化
2019-02-21
Redis持久化
Redis 持久化之 AOF
2019-01-29
Redis持久化