深度剖析Redis6的持久化機制(大量圖片說明,簡潔易懂)

跟著Mic學架構發表於2021-10-22

Redis的強勁效能很大程度上是由於它所有的資料都儲存在記憶體中,當然如果redis重啟或者伺服器故障導致redis重啟,所有儲存在記憶體中的資料就會丟失。但是在某些情況下,我們希望Redis在重啟後能夠保證資料不會丟失。

  1. 將redis作為nosql資料庫使用。

  2. 將Redis作為高效快取伺服器,快取被擊穿後對後端資料庫層面的瞬時壓力是特別大的,所有快取同時失效可能會導致雪崩。

這時我們希望Redis能將資料從記憶體中以某種形式同步到硬碟上,使得重啟後可以根據硬碟中的記錄來恢復資料。

Redis支援兩種方式的持久化,一種是RDB方式、另一種是AOF(append-only-file)方式,兩種持久化方式可以單獨使用其中一種,也可以將這兩種方式結合使用。

  • RDB:根據指定的規則“定時”將記憶體中的資料儲存在硬碟上,
  • AOF:每次執行命令後將命令本身記錄下來。

RDB模式

RDB的持久化方式是通過快照(snapshotting)完成的,它是Redis預設的持久化方式,配置如下。

# save 3600 1
# save 300 100
# save 60 10000

Redis允許使用者自定義快照條件,當符合快照條件時,Redis會自動執行快照操作。快照的條件可以由使用者在配置檔案中配置。配置格式如下

save <seconds> <changes>

第一個引數是時間視窗,第二個是鍵的個數,也就是說,在第一個時間引數配置範圍內被更改的鍵的個數大於後面的changes時,即符合快照條件。當觸發條件時,Redis會自動將記憶體中的資料生成一份副本並儲存在磁碟上,

這個過程稱之為“快照”,除了上述規則之外,還有以下幾種方式生成快照。

  1. 根據配置規則進行自動快照
  2. 使用者執行SAVE或者GBSAVE命令
  3. 執行FLUSHALL命令
  4. 執行復制(replication)時

根據配置規則進行自動快照

  • 修改redis.conf檔案,表示5秒內,有一個key發生變化,就會生成rdb檔案。
  save 5 1                # 表示3600s以內至少發生1個key變化(新增、修改、刪除),則重寫rdb檔案
  save 300 100
  save 60 10000
  • 修改檔案儲存路徑

    dir /data/program/redis/bin
    
  • 其他引數配置說明

    引數 說明
    dir rdb檔案預設在啟動目錄下(相對路徑) config get dir 獲取
    dbfilename 檔名稱
    rdbcompression 開啟壓縮可以節省儲存空間,但是會消耗一些CPU的計算時間,預設開啟
    rdbchecksum 使用CRC64演算法來進行資料校驗,但是這樣做會增加大約10%的效能消耗,如果希望獲取到最大的效能提升,可以關閉此功能。

如果需要關閉RDB的持久化機制,可以參考如下配置,開啟save,並註釋其他規則即可

save ""
#save 900 1
#save 300 10
#save 60 10000

使用者執行SAVE或者GBSAVE命令

除了讓Redis自動進行快照以外,當我們對服務進行重啟或者伺服器遷移我們需要人工去幹預備份。redis提供了兩條命令來完成這個任務

  1. save命令

    如圖4-24所示,當執行save命令時,Redis同步做快照操作,在快照執行過程中會阻塞所有來自客戶端的請求。當redis記憶體中的資料較多時,通過該命令將導致Redis較長時間的不響應。所以不建議在生產環境上使用這個命令,而是推薦使用bgsave命令

    image-20210712184050955

    圖4-24
  2. bgsave命令

    如圖4-25所示,bgsave命令可以在後臺非同步地進行快照操作,快照的同時伺服器還可以繼續響應來自客戶端的請求。執行BGSAVE後,Redis會立即返回ok表示開始執行快照操作,在redis-cli終端,通過下面這個命令可以獲取最近一次成功執行快照的時間(以 UNIX 時間戳格式表示)。

    LASTSAVE
    

1:redis使用fork函式複製一份當前程式的副本(子程式)

2:父程式繼續接收並處理客戶端發來的命令,而子程式開始將記憶體中的資料寫入硬碟中的臨時檔案

3:當子程式寫入完所有資料後會用該臨時檔案替換舊的RDB檔案,至此,一次快照操作完成。

注意:redis在進行快照的過程中不會修改RDB檔案,只有快照結束後才會將舊的檔案替換成新的,也就是說任何時候RDB檔案都是完整的。 這就使得我們可以通過定時備份RDB檔案來實現redis資料庫的備份, RDB檔案是經過壓縮的二進位制檔案,佔用的空間會小於記憶體中的資料,更加利於傳輸。

bgsave是非同步執行快照的,bgsave寫入的資料就是for程式時redis的資料狀態,一旦完成fork,後續執行的新的客戶端命令對資料產生的變更都不會反應到本次快照

Redis啟動後會讀取RDB快照檔案,並將資料從硬碟載入到記憶體。根據資料量大小以及伺服器效能不同,這個載入的時間也不同。

image-20210712183559812

圖4-25

執行FLUSHALL命令

該命令在前面講過,會清除redis在記憶體中的所有資料。執行該命令後,只要redis中配置的快照規則不為空,

也就是save 的規則存在。redis就會執行一次快照操作。不管規則是什麼樣的都會執行。如果沒有定義快照規則,就不會執行快照操作。

執行復制(replication)時

該操作主要是在主從模式下,redis會在複製初始化時進行自動快照。這個會在後面講到;

這裡只需要瞭解當執行復制操作時,即時沒有定義自動快照規則,並且沒有手動執行過快照操作,它仍然會生成RDB快照檔案。

RDB資料恢復演示

  • 準備初始資料
  redis> set k1 1
  redis> set k2 2
  redis> set k3 3
  redis> set k4 4
  redis> set k5 5
  • 通過shutdown命令關閉觸發save

    redis> shutdown
    
  • 備份dump.rdb檔案(用來後續恢復)

    cp dump.rdb dump.rdb.bak
    
  • 接著再啟動redis-server(systemctl restart redis_6379),通過keys命令檢視,發現資料還在

    keys *
    

模擬資料丟失

  • 執行flushall

    redis> flushall
    
  • shutdown(重新生成沒有資料的快照,用來模擬後續的資料恢復)

    redis> shutdown
    
  • 再次啟動redis, 通過keys 命令檢視,此時rdb中沒有任何資料。

  • 恢復之前備份的rdb檔案(之前儲存了資料的rdb快照)

    mv dump.rdb.bak dump.rdb
    
  • 再次重啟redis,可以看到之前快照儲存的資料

    keys *
    

檔案的優勢和劣勢

一、優勢

  1.RDB是一個非常緊湊(compact)的檔案,它儲存了redis 在某個時間點上的資料集,這種檔案非常適合用於進行備份和災難恢復。

  2.生成RDB檔案的時候,redis主程式會fork()一個子程式來處理所有儲存工作,主程式不需要進行任何磁碟IO操作。

  3.RDB 在恢復大資料集時的速度比AOF的恢復速度要快。

二、劣勢

  • 1、RDB方式資料沒辦法做到實時持久化/秒級持久化。因為bgsave每次執行都要執行fork操作建立子程式,頻繁執行成本過高

  • 2、在一定間隔時間做一次備份,所以如果redis意外down掉的話,就會丟失最後一次快照之後的所有修改(資料有丟失)。

如果資料相對來說比較重要,希望將損失降到最小,則可以使用AOF方式進行持久化。

AOF模式

AOF(Append Only File):Redis 預設不開啟。AOF採用日誌的形式來記錄每個寫操作,並追加到檔案中。開啟後,執行更改Redis資料的命令時,就會把命令寫入到AOF檔案中。

Redis 重啟時會根據日誌檔案的內容把寫指令從前到後執行一次以完成資料的恢復工作。

AOF配置開關

# 開關
appendonly no  /yes
# 檔名
appendfilename "appendonly.aof"

通過修改redis.conf重啟redis之後:systemctl restart redis_6379。

再次執行redis的相關操作命令,會發現在指定的dir目錄下生成appendonly.aof檔案,通過vim檢視該檔案內容如下

*2
$6
SELECT
$1
0
*3
$3
set
$4
name
$3
mic
*3
$3
set
$4
name
$3
123

AOF配置相關問題解答

問題1:資料都是實時持久化到磁碟嗎?

雖然每次執行更改Redis資料庫內容的操作時,AOF都會將命令記錄在AOF檔案中,但是事實上,由於作業系統的快取機制,資料並沒有真正地寫入硬碟,而是進入了系統的硬碟快取。在預設情況下系統每30秒會執行一次同步操作。以便將硬碟快取中的內容真正地寫入硬碟。

在這30秒的過程中如果系統異常退出則會導致硬碟快取中的資料丟失。一般來說能夠啟用AOF的前提是業務場景不能容忍這樣的資料損失,這個時候就需要Redis在寫入AOF檔案後主動要求系統將快取內容同步到硬碟中。在redis.conf中通過如下配置來設定同步機制。

引數 說明
appendfsync everysec AOF持久化策略(硬碟快取到磁碟),預設everysec
1 no 表示不執行fsync,由作業系統保證資料同步到磁碟,速度最快,但是不太安全;
2 always 表示每次寫入都執行fsync,以保證資料同步到磁碟,效率很低;
3 everysec表示每秒執行一次fsync,可能會導致丟失這1s資料。通常選擇 everysec ,兼顧安全性和效率。

問題2:檔案越來越大,怎麼辦?

由於AOF持久化是Redis不斷將寫命令記錄到 AOF 檔案中,隨著Redis不斷的執行,AOF 的檔案會越來越大,檔案越大,佔用伺服器記憶體越大以及 AOF 恢復要求時間越長。

例如set gupao 666,執行1000次,結果都是gupao=666。

為了解決這個問題,Redis新增了重寫機制,當AOF檔案的大小超過所設定的閾值時,Redis就會啟動AOF檔案的內容壓縮,只保留可以恢復資料的最小指令集。

可以使用命令下面這個命令主動觸發重寫

redis> bgrewriteaof

AOF 檔案重寫並不是對原檔案進行重新整理,而是直接讀取伺服器現有的鍵值對,然後用一條命令去代替之前記錄這個鍵值對的多條命令,生成一個新的檔案後去替換原來的 AOF 檔案。

重寫觸發機制如下

引數 說明
auto-aof-rewrite-percentage 預設值為100。表示的是當目前的AOF檔案大小超過上一次重寫時的AOF檔案大小的百分之多少時會再次進行重寫,如果之前沒有重寫過,則以啟動時AOF檔案大小為依據
auto-aof-rewrite-min-size 預設64M。表示限制了允許重寫的最小AOF檔案大小,通常在AOF檔案很小的情況下即使其中有很多冗餘的命令我們也並不太關心

在啟動時,Redis會逐個執行AOF檔案中的命令來將硬碟中的資料載入到記憶體中,載入的速度相對於RDB會慢一些

問題:重寫過程中,AOF檔案被更改了怎麼辦?

Redis 可以在 AOF 檔案體積變得過大時,自動地在後臺對 AOF 進行重寫: 重寫後的新 AOF 檔案包含了恢復當前資料集所需的最小命令集合。

重寫的流程是這樣,

  • 主程式會fork一個子程式出來進行AOF重寫,這個重寫過程並不是基於原有的aof檔案來做的,而是有點類似於快照的方式,全量遍歷記憶體中的資料,然後逐個序列到aof檔案中。
  • 在fork子程式這個過程中,服務端仍然可以對外提供服務,那這個時候重寫的aof檔案的資料和redis記憶體資料不一致了怎麼辦?不用擔心,這個過程中,主程式的資料更新操作,會快取到aof_rewrite_buf中,也就是單獨開闢一塊快取來儲存重寫期間收到的命令,當子程式重寫完以後再把快取中的資料追加到新的aof檔案。
  • 當所有的資料全部追加到新的aof檔案中後,把新的aof檔案重新命名正式的檔名字,此後所有的操作都會被寫入新的aof檔案。
  • 如果在rewrite過程中出現故障,不會影響原來aof檔案的正常工作,只有當rewrite完成後才會切換檔案。因此這個rewrite過程是比較可靠的。

img

圖4-26

Redis允許同時開啟AOF和RDB,既保證了資料安全又使得進行備份等操作十分容易。如果同時開啟後,Redis重啟會使用AOF檔案來恢復資料,因為AOF方式的持久化可能丟失的資料更少。

AOF的優劣勢

優點:

1、AOF 持久化的方法提供了多種的同步頻率,即使使用預設的同步頻率每秒同步一次,Redis 最多也就丟失 1 秒的資料而已。

缺點:

1、對於具有相同資料的的Redis,AOF 檔案通常會比 RDB 檔案體積更大(RDB存的是資料快照)。

2、雖然 AOF 提供了多種同步的頻率,預設情況下,每秒同步一次的頻率也具有較高的效能。在高併發的情況下,RDB 比 AOF 具好更好的效能保證。
關注[跟著Mic學架構]公眾號,獲取更多精品原創

相關文章