Redis為持久化提供了兩種方式:
- RDB:在指定的時間間隔能對你的資料進行快照儲存。
- AOF:記錄每次對伺服器寫的操作,當伺服器重啟的時候會重新執行這些命令來恢復原始的資料。
本文將通過下面內容的介紹,希望能夠讓大家更全面、清晰的認識這兩種持久化方式,同時理解這種儲存資料的思路,應用於自己的系統設計中。
- 持久化的配置
- RDB與AOF持久化的工作原理
- 如何從持久化中恢復資料
- 關於效能與實踐建議
持久化的配置
為了使用持久化的功能,我們需要先知道該如何開啟持久化的功能。
RDB的持久化配置
# 時間策略
save 900 1
save 300 10
save 60 10000
# 檔名稱
dbfilename dump.rdb
# 檔案儲存路徑
dir /home/work/app/redis/data/
# 如果持久化出錯,主程式是否停止寫入
stop-writes-on-bgsave-error yes
# 是否壓縮
rdbcompression yes
# 匯入時是否檢查
rdbchecksum yes
複製程式碼
配置其實非常簡單,這裡說一下持久化的時間策略具體是什麼意思。
save 900 1
表示900s內如果有1條是寫入命令,就觸發產生一次快照,可以理解為就進行一次備份save 300 10
表示300s內有10條寫入,就產生快照
下面的類似,那麼為什麼需要配置這麼多條規則呢?因為Redis每個時段的讀寫請求肯定不是均衡的,為了平衡效能與資料安全,我們可以自由定製什麼情況下觸發備份。所以這裡就是根據自身Redis寫入情況來進行合理配置。
stop-writes-on-bgsave-error yes
這個配置也是非常重要的一項配置,這是當備份程式出錯時,主程式就停止接受新的寫入操作,是為了保護持久化的資料一致性問題。如果自己的業務有完善的監控系統,可以禁止此項配置, 否則請開啟。
關於壓縮的配置 rdbcompression yes
,建議沒有必要開啟,畢竟Redis本身就屬於CPU密集型伺服器,再開啟壓縮會帶來更多的CPU消耗,相比硬碟成本,CPU更值錢。
當然如果你想要禁用RDB配置,也是非常容易的,只需要在save的最後一行寫上:save ""
AOF的配置
# 是否開啟aof
appendonly yes
# 檔名稱
appendfilename "appendonly.aof"
# 同步方式
appendfsync everysec
# aof重寫期間是否同步
no-appendfsync-on-rewrite no
# 重寫觸發配置
auto-aof-rewrite-percentage 100
auto-aof-rewrite-min-size 64mb
# 載入aof時如果有錯如何處理
aof-load-truncated yes
# 檔案重寫策略
aof-rewrite-incremental-fsync yes
複製程式碼
還是重點解釋一些關鍵的配置:
appendfsync everysec
它其實有三種模式:
- always:把每個寫命令都立即同步到aof,很慢,但是很安全
- everysec:每秒同步一次,是折中方案
- no:redis不處理交給OS來處理,非常快,但是也最不安全
一般情況下都採用 everysec 配置,這樣可以兼顧速度與安全,最多損失1s的資料。
aof-load-truncated yes
如果該配置啟用,在載入時發現aof尾部不正確是,會向客戶端寫入一個log,但是會繼續執行,如果設定為 no
,發現錯誤就會停止,必須修復後才能重新載入。
工作原理
關於原理部分,我們主要來看RDB與AOF是如何完成持久化的,他們的過程是如何。
在介紹原理之前先說下Redis內部的定時任務機制,定時任務執行的頻率可以在配置檔案中通過 hz 10
來設定(這個配置表示1s內執行10次,也就是每100ms觸發一次定時任務)。該值最大能夠設定為:500,但是不建議超過:100,因為值越大說明執行頻率越頻繁越高,這會帶來CPU的更多消耗,從而影響主程式讀寫效能。
定時任務使用的是Redis自己實現的 TimeEvent,它會定時去呼叫一些命令完成定時任務,這些任務可能會阻塞主程式導致Redis效能下降。因此我們在配置Redis時,一定要整體考慮一些會觸發定時任務的配置,根據實際情況進行調整。
RDB的原理
在Redis中RDB持久化的觸發分為兩種:自己手動觸發與Redis定時觸發。
針對RDB方式的持久化,手動觸發可以使用:
- save:會阻塞當前Redis伺服器,直到持久化完成,線上應該禁止使用。
- bgsave:該觸發方式會fork一個子程式,由子程式負責持久化過程,因此阻塞只會發生在fork子程式的時候。
而自動觸發的場景主要是有以下幾點:
- 根據我們的
save m n
配置規則自動觸發; - 從節點全量複製時,主節點傳送rdb檔案給從節點完成複製操作,主節點會觸發
bgsave
; - 執行
debug reload
時; - 執行
shutdown
時,如果沒有開啟aof,也會觸發。
由於 save
基本不會被使用到,我們重點看看 bgsave
這個命令是如何完成RDB的持久化的。
這裡注意的是 fork
操作會阻塞,導致Redis讀寫效能下降。我們可以控制單個Redis例項的最大記憶體,來儘可能降低Redis在fork時的事件消耗。以及上面提到的自動觸發的頻率減少fork次數,或者使用手動觸發,根據自己的機制來完成持久化。
AOF的原理
AOF的整個流程大體來看可以分為兩步,一步是命令的實時寫入(如果是 appendfsync everysec
配置,會有1s損耗),第二步是對aof檔案的重寫。
對於增量追加到檔案這一步主要的流程是:命令寫入=》追加到aof_buf =》同步到aof磁碟。那麼這裡為什麼要先寫入buf在同步到磁碟呢?如果實時寫入磁碟會帶來非常高的磁碟IO,影響整體效能。
aof重寫是為了減少aof檔案的大小,可以手動或者自動觸發,關於自動觸發的規則請看上面配置部分。fork的操作也是發生在重寫這一步,也是這裡會對主程式產生阻塞。
手動觸發: bgrewriteaof
,自動觸發 就是根據配置規則來觸發,當然自動觸發的整體時間還跟Redis的定時任務頻率有關係。
下面來看看重寫的一個流程圖:
對於上圖有四個關鍵點補充一下:
- 在重寫期間,由於主程式依然在響應命令,為了保證最終備份的完整性;因此它依然會寫入舊的AOF file中,如果重寫失敗,能夠保證資料不丟失。
- 為了把重寫期間響應的寫入資訊也寫入到新的檔案中,因此也會為子程式保留一個buf,防止新寫的file丟失資料。
- 重寫是直接把當前記憶體的資料生成對應命令,並不需要讀取老的AOF檔案進行分析、命令合併。
- AOF檔案直接採用的文字協議,主要是相容性好、追加方便、可讀性高可認為修改修復。
不能是RDB還是AOF都是先寫入一個臨時檔案,然後通過
rename
完成檔案的替換工作。
從持久化中恢復資料
資料的備份、持久化做完了,我們如何從這些持久化檔案中恢復資料呢?如果一臺伺服器上有既有RDB檔案,又有AOF檔案,該載入誰呢?
其實想要從這些檔案中恢復資料,只需要重新啟動Redis即可。我們還是通過圖來了解這個流程:
啟動時會先檢查AOF檔案是否存在,如果不存在就嘗試載入RDB。那麼為什麼會優先載入AOF呢?因為AOF儲存的資料更完整,通過上面的分析我們知道AOF基本上最多損失1s的資料。
效能與實踐
通過上面的分析,我們都知道RDB的快照、AOF的重寫都需要fork,這是一個重量級操作,會對Redis造成阻塞。因此為了不影響Redis主程式響應,我們需要儘可能降低阻塞。
- 降低fork的頻率,比如可以手動來觸發RDB生成快照、與AOF重寫;
- 控制Redis最大使用記憶體,防止fork耗時過長;
- 使用更牛逼的硬體;
- 合理配置Linux的記憶體分配策略,避免因為實體記憶體不足導致fork失敗。
線上上我們到底該怎麼做?我提供一些自己的實踐經驗。
- 如果Redis中的資料並不是特別敏感或者可以通過其它方式重寫生成資料,可以關閉持久化,如果丟失資料可以通過其它途徑補回;
- 自己制定策略定期檢查Redis的情況,然後可以手動觸發備份、重寫資料;
- 單機如果部署多個例項,要防止多個機器同時執行持久化、重寫操作,防止出現記憶體、CPU、IO資源競爭,讓持久化變為序列;
- 可以加入主從機器,利用一臺從機器進行備份處理,其它機器正常響應客戶端的命令;
- RDB持久化與AOF持久化可以同時存在,配合使用。
本文的內容主要是運維上的一些注意點,但我們開發者瞭解到這些知識,在某些時候有助於我們發現詭異的bug。接下來會介紹Redis的主從複製與叢集的知識。
公眾號:dayuTalk