Redis是什麼?
Redis(Remote Dictionary Server
)是一個使用 C 語言編寫的,高效能非關係型的鍵值對資料庫。與傳統資料庫不同的是,Redis 的資料是存在記憶體中的,所以讀寫速度非常快,被廣泛應用於快取方向。Redis可以將資料寫入磁碟中,保證了資料的安全不丟失,而且Redis的操作是原子性的。
Redis的優點?
- 基於記憶體操作,記憶體讀寫速度快。
- Redis是單執行緒的,避免執行緒切換開銷及多執行緒的競爭問題。單執行緒是指網路請求使用一個執行緒來處理,即一個執行緒處理所有網路請求,Redis 執行時不止有一個執行緒,比如資料持久化的過程會另起執行緒。
- 支援多種資料型別,包括String、Hash、List、Set、ZSet等。
- 支援持久化。Redis支援RDB和AOF兩種持久化機制,持久化功能可以有效地避免資料丟失問題。
- 支援事務。Redis的所有操作都是原子性的,同時Redis還支援對幾個操作合併後的原子性執行。
- 支援主從複製。主節點會自動將資料同步到從節點,可以進行讀寫分離。
Redis為什麼這麼快?
- 基於記憶體:Redis是使用記憶體儲存,沒有磁碟IO上的開銷。資料存在記憶體中,讀寫速度快。
- 單執行緒實現( Redis 6.0以前):Redis使用單個執行緒處理請求,避免了多個執行緒之間執行緒切換和鎖資源爭用的開銷。
- IO多路複用模型:Redis 採用 IO 多路複用技術。Redis 使用單執行緒來輪詢描述符,將資料庫的操作都轉換成了事件,不在網路I/O上浪費過多的時間。
- 高效的資料結構:Redis 每種資料型別底層都做了優化,目的就是為了追求更快的速度。
Redis為何選擇單執行緒?
- 避免過多的上下文切換開銷。程式始終執行在程式中單個執行緒內,沒有多執行緒切換的場景。
- 避免同步機制的開銷:如果 Redis選擇多執行緒模型,需要考慮資料同步的問題,則必然會引入某些同步機制,會導致在運算元據過程中帶來更多的開銷,增加程式複雜度的同時還會降低效能。
- 實現簡單,方便維護:如果 Redis使用多執行緒模式,那麼所有的底層資料結構的設計都必須考慮執行緒安全問題,那麼 Redis 的實現將會變得更加複雜。
Redis應用場景有哪些?
- 快取熱點資料,緩解資料庫的壓力。
- 利用 Redis 原子性的自增操作,可以實現計數器的功能,比如統計使用者點贊數、使用者訪問數等。
- 簡單的訊息佇列,可以使用Redis自身的釋出/訂閱模式或者List來實現簡單的訊息佇列,實現非同步操作。
- 限速器,可用於限制某個使用者訪問某個介面的頻率,比如秒殺場景用於防止使用者快速點選帶來不必要的壓力。
- 好友關係,利用集合的一些命令,比如交集、並集、差集等,實現共同好友、共同愛好之類的功能。
Memcached和Redis的區別?
- Redis 只使用單核,而 Memcached 可以使用多核。
- MemCached 資料結構單一,僅用來快取資料,而 Redis 支援多種資料型別。
- MemCached 不支援資料持久化,重啟後資料會消失。Redis 支援資料持久化。
- Redis 提供主從同步機制和 cluster 叢集部署能力,能夠提供高可用服務。Memcached 沒有提供原生的叢集模式,需要依靠客戶端實現往叢集中分片寫入資料。
- Redis 的速度比 Memcached 快很多。
- Redis 使用單執行緒的多路 IO 複用模型,Memcached使用多執行緒的非阻塞 IO 模型。
Redis 資料型別有哪些?
基本資料型別:
1、String:最常用的一種資料型別,String型別的值可以是字串、數字或者二進位制,但值最大不能超過512MB。
2、Hash:Hash 是一個鍵值對集合。
3、Set:無序去重的集合。Set 提供了交集、並集等方法,對於實現共同好友、共同關注等功能特別方便。
4、List:有序可重複的集合,底層是依賴雙向連結串列實現的。
5、SortedSet(ZSet):有序Set。內部維護了一個score
的引數來實現。適用於排行榜和帶權重的訊息佇列等場景。
特殊的資料型別:
1、Bitmap:點陣圖,可以認為是一個以位為單位陣列,陣列中的每個單元只能存0或者1,陣列的下標在 Bitmap 中叫做偏移量。Bitmap的長度與集合中元素個數無關,而是與基數的上限有關。
2、Hyperloglog。HyperLogLog 是用來做基數統計的演算法,其優點是,在輸入元素的數量或者體積非常非常大時,計算基數所需的空間總是固定的、並且是很小的。典型的使用場景是統計獨立訪客。
3、Geospatial :主要用於儲存地理位置資訊,並對儲存的資訊進行操作,適用場景如定位、附近的人等。
Redis事務
事務的原理是將一個事務範圍內的若干命令傳送給 Redis,然後再讓 Redis 依次執行這些命令。
事務的生命週期:
- 使用
MULTI
開啟一個事務; - 在開啟事務的時候,每次操作的命令將會被插入到一個佇列中,同時這個命令並不會被真正執行;
EXEC
命令進行提交事務。
一個事務範圍內某個命令出錯不會影響其他命令的執行,不保證原子性:
first:0>MULTI
"OK"
first:0>set a 1
"QUEUED"
first:0>set b 2 3 4
"QUEUED"
first:0>set c 6
"QUEUED"
first:0>EXEC
1) "OK"
2) "OK"
3) "OK"
4) "ERR syntax error"
5) "OK"
6) "OK"
7) "OK"
WATCH命令
WATCH
命令可以監控一個或多個鍵,一旦其中有一個鍵被修改,之後的事務就不會執行(類似於樂觀鎖)。執行EXEC
命令之後,就會自動取消監控。
first:0>watch name
"OK"
first:0>set name 1
"OK"
first:0>MULTI
"OK"
first:0>set name 2
"QUEUED"
first:0>set gender 1
"QUEUED"
first:0>EXEC
(nil)
first:0>get gender
(nil)
比如上面的程式碼中:
watch name
開啟了對name
這個key
的監控- 修改
name
的值 - 開啟事務a
- 在事務a中設定了
name
和gender
的值 - 使用
EXEC
命令進提交事務 - 使用命令
get gender
發現不存在,即事務a沒有執行
使用UNWATCH
可以取消WATCH
命令對key
的監控,所有監控鎖將會被取消。
持久化機制
持久化就是把記憶體的資料寫到磁碟中,防止服務當機導致記憶體資料丟失。
Redis支援兩種方式的持久化,一種是RDB
的方式,一種是AOF
的方式。前者會根據指定的規則定時將記憶體中的資料儲存在硬碟上,而後者在每次執行完命令後將命令記錄下來。一般將兩者結合使用。
RDB方式
RDB
是 Redis 預設的持久化方案。RDB持久化時會將記憶體中的資料寫入到磁碟中,在指定目錄下生成一個dump.rdb
檔案。Redis 重啟會載入dump.rdb
檔案恢復資料。
bgsave
是主流的觸發 RDB 持久化的方式,執行過程如下:
- 執行
BGSAVE
命令 - Redis 父程式判斷當前是否存在正在執行的子程式,如果存在,
BGSAVE
命令直接返回。 - 父程式執行
fork
操作建立子程式,fork操作過程中父程式會阻塞。 - 父程式
fork
完成後,父程式繼續接收並處理客戶端的請求,而子程式開始將記憶體中的資料寫進硬碟的臨時檔案; - 當子程式寫完所有資料後會用該臨時檔案替換舊的 RDB 檔案。
Redis啟動時會讀取RDB快照檔案,將資料從硬碟載入記憶體。通過 RDB 方式的持久化,一旦Redis異常退出,就會丟失最近一次持久化以後更改的資料。
觸發 RDB 持久化的方式:
手動觸發:使用者執行
SAVE
或BGSAVE
命令。SAVE
命令執行快照的過程會阻塞所有客戶端的請求,應避免在生產環境使用此命令。BGSAVE
命令可以在後臺非同步進行快照操作,快照的同時伺服器還可以繼續響應客戶端的請求,因此需要手動執行快照時推薦使用BGSAVE
命令。被動觸發:
- 根據配置規則進行自動快照,如
SAVE 100 10
,100秒內至少有10個鍵被修改則進行快照。 - 如果從節點執行全量複製操作,主節點會自動執行
BGSAVE
生成 RDB 檔案併傳送給從節點。 - 預設情況下執行
shutdown
命令時,如果沒有開啟 AOF 持久化功能則自動執行·BGSAVE·。
- 根據配置規則進行自動快照,如
優點:
- Redis 載入 RDB 恢復資料遠遠快於 AOF 的方式。
- 使用單獨子程式來進行持久化,主程式不會進行任何 IO 操作,保證了 Redis 的高效能。
缺點:
- RDB方式資料無法做到實時持久化。因為
BGSAVE
每次執行都要執行fork
操作建立子程式,屬於重量級操作,頻繁執行成本比較高。 - RDB 檔案使用特定二進位制格式儲存,Redis 版本升級過程中有多個格式的 RDB 版本,存在老版本 Redis 無法相容新版 RDB 格式的問題。
AOF方式
AOF(append only file)持久化:以獨立日誌的方式記錄每次寫命令,Redis重啟時會重新執行AOF檔案中的命令達到恢復資料的目的。AOF的主要作用是解決了資料持久化的實時性,AOF 是Redis持久化的主流方式。
預設情況下Redis沒有開啟AOF方式的持久化,可以通過appendonly
引數啟用:appendonly yes
。開啟AOF方式持久化後每執行一條寫命令,Redis就會將該命令寫進aof_buf
緩衝區,AOF緩衝區根據對應的策略向硬碟做同步操作。
預設情況下系統每30秒會執行一次同步操作。為了防止緩衝區資料丟失,可以在Redis寫入AOF檔案後主動要求系統將緩衝區資料同步到硬碟上。可以通過appendfsync
引數設定同步的時機。
appendfsync always //每次寫入aof檔案都會執行同步,最安全最慢,不建議配置
appendfsync everysec //既保證效能也保證安全,建議配置
appendfsync no //由作業系統決定何時進行同步操作
複製程式碼
接下來看一下 AOF 持久化執行流程:
- 所有的寫入命令會追加到 AOP 緩衝區中。
- AOF 緩衝區根據對應的策略向硬碟同步。
- 隨著 AOF 檔案越來越大,需要定期對 AOF 檔案進行重寫,達到壓縮檔案體積的目的。AOF檔案重寫是把Redis程式內的資料轉化為寫命令同步到新AOF檔案的過程。
- 當 Redis 伺服器重啟時,可以載入 AOF 檔案進行資料恢復。
優點:
- AOF可以更好的保護資料不丟失,可以配置 AOF 每秒執行一次
fsync
操作,如果Redis程式掛掉,最多丟失1秒的資料。 - AOF以
append-only
的模式寫入,所以沒有磁碟定址的開銷,寫入效能非常高。
缺點:
- 對於同一份檔案AOF檔案比RDB資料快照要大。
- 資料恢復比較慢。
主從複製
Redis的複製功能是支援多個資料庫之間的資料同步。主資料庫可以進行讀寫操作,當主資料庫的資料發生變化時會自動將資料同步到從資料庫。從資料庫一般是隻讀的,它會接收主資料庫同步過來的資料。一個主資料庫可以有多個從資料庫,而一個從資料庫只能有一個主資料庫。
//啟動Redis例項作為主資料庫
redis-server
//啟動另一個例項作為從資料庫
redis-server --port 6380 --slaveof 127.0.0.1 6379
slaveof 127.0.0.1 6379
//停止接收其他資料庫的同步並轉化為主資料庫
SLAVEOF NO ONE
主從複製的原理?
- 當啟動一個從節點時,它會傳送一個
PSYNC
命令給主節點; - 如果是從節點初次連線到主節點,那麼會觸發一次全量複製。此時主節點會啟動一個後臺執行緒,開始生成一份
RDB
快照檔案; - 同時還會將從客戶端 client 新收到的所有寫命令快取在記憶體中。
RDB
檔案生成完畢後, 主節點會將RDB
檔案傳送給從節點,從節點會先將RDB
檔案寫入本地磁碟,然後再從本地磁碟載入到記憶體中; - 接著主節點會將記憶體中快取的寫命令傳送到從節點,從節點同步這些資料;
- 如果從節點跟主節點之間網路出現故障,連線斷開了,會自動重連,連線之後主節點僅會將部分缺失的資料同步給從節點。
哨兵Sentinel
主從複製存在不能自動故障轉移、達不到高可用的問題。哨兵模式解決了這些問題。通過哨兵機制可以自動切換主從節點。
客戶端連線Redis的時候,先連線哨兵,哨兵會告訴客戶端Redis主節點的地址,然後客戶端連線上Redis並進行後續的操作。當主節點當機的時候,哨兵監測到主節點當機,會重新推選出某個表現良好的從節點成為新的主節點,然後通過釋出訂閱模式通知其他的從伺服器,讓它們切換主機。
工作原理
- 每個
Sentinel
以每秒鐘一次的頻率向它所知道的Master
,Slave
以及其他Sentinel
例項傳送一個PING
命令。 - 如果一個例項距離最後一次有效回覆
PING
命令的時間超過指定值, 則這個例項會被Sentine
標記為主觀下線。 - 如果一個
Master
被標記為主觀下線,則正在監視這個Master
的所有Sentinel
要以每秒一次的頻率確認Master
是否真正進入主觀下線狀態。 - 當有足夠數量的
Sentinel
(大於等於配置檔案指定值)在指定的時間範圍內確認Master
的確進入了主觀下線狀態, 則Master
會被標記為客觀下線 。若沒有足夠數量的Sentinel
同意Master
已經下線,Master
的客觀下線狀態就會被解除。若Master
重新向Sentinel
的PING
命令返回有效回覆,Master
的主觀下線狀態就會被移除。 - 哨兵節點會選舉出哨兵 leader,負責故障轉移的工作。
- 哨兵 leader 會推選出某個表現良好的從節點成為新的主節點,然後通知其他從節點更新主節點資訊。
Redis cluster
哨兵模式解決了主從複製不能自動故障轉移、達不到高可用的問題,但還是存在主節點的寫能力、容量受限於單機配置的問題。而cluster模式實現了Redis的分散式儲存,每個節點儲存不同的內容,解決主節點的寫能力、容量受限於單機配置的問題。
Redis cluster叢集節點最小配置6個節點以上(3主3從),其中主節點提供讀寫操作,從節點作為備用節點,不提供請求,只作為故障轉移使用。
Redis cluster採用虛擬槽分割槽,所有的鍵根據雜湊函式對映到0~16383個整數槽內,每個節點負責維護一部分槽以及槽所對映的鍵值資料。
雜湊槽是如何對映到 Redis 例項上的?
- 對鍵值對的
key
使用crc16
演算法計算一個結果 - 將結果對 16384 取餘,得到的值表示
key
對應的雜湊槽 - 根據該槽資訊定位到對應的例項
優點:
- 無中心架構,支援動態擴容;
- 資料按照
slot
儲存分佈在多個節點,節點間資料共享,可動態調整資料分佈; - 高可用性。部分節點不可用時,叢集仍可用。叢集模式能夠實現自動故障轉移(failover),節點之間通過
gossip
協議交換狀態資訊,用投票機制完成Slave
到Master
的角色轉換。
缺點:
- 不支援批量操作(pipeline)。
- 資料通過非同步複製,不保證資料的強一致性。
- 事務操作支援有限,只支援多
key
在同一節點上的事務操作,當多個key
分佈於不同的節點上時無法使用事務功能。 key
作為資料分割槽的最小粒度,不能將一個很大的鍵值物件如hash
、list
等對映到不同的節點。- 不支援多資料庫空間,單機下的Redis可以支援到16個資料庫,叢集模式下只能使用1個資料庫空間。
過期鍵的刪除策略?
1、被動刪除(惰性)。在訪問key時,如果發現key已經過期,那麼會將key刪除。
2、主動刪除(定期)。定時清理key,每次清理會依次遍歷所有DB,從db隨機取出20個key,如果過期就刪除,如果其中有5個key過期,那麼就繼續對這個db進行清理,否則開始清理下一個db。
3、記憶體不夠時清理。Redis有最大記憶體的限制,通過maxmemory引數可以設定最大記憶體,當使用的記憶體超過了設定的最大記憶體,就要進行記憶體釋放, 在進行記憶體釋放的時候,會按照配置的淘汰策略清理記憶體。
記憶體淘汰策略有哪些?
當Redis的記憶體超過最大允許的記憶體之後,Redis 會觸發記憶體淘汰策略,刪除一些不常用的資料,以保證Redis伺服器正常執行。
Redisv4.0前提供 6 種資料淘汰策略:
- volatile-lru:LRU(
Least Recently Used
),最近使用。利用LRU演算法移除設定了過期時間的key - allkeys-lru:當記憶體不足以容納新寫入資料時,從資料集中移除最近最少使用的key
- volatile-ttl:從已設定過期時間的資料集中挑選將要過期的資料淘汰
- volatile-random:從已設定過期時間的資料集中任意選擇資料淘汰
- allkeys-random:從資料集中任意選擇資料淘汰
- no-eviction:禁止刪除資料,當記憶體不足以容納新寫入資料時,新寫入操作會報錯
Redisv4.0後增加以下兩種:
- volatile-lfu:LFU,Least Frequently Used,最少使用,從已設定過期時間的資料集中挑選最不經常使用的資料淘汰。
- allkeys-lfu:當記憶體不足以容納新寫入資料時,從資料集中移除最不經常使用的key。
記憶體淘汰策略可以通過配置檔案來修改,相應的配置項是maxmemory-policy
,預設配置是noeviction
。
如何保證快取與資料庫雙寫時的資料一致性?
1、先刪除快取再更新資料庫
進行更新操作時,先刪除快取,然後更新資料庫,後續的請求再次讀取時,會從資料庫讀取後再將新資料更新到快取。
存在的問題:刪除快取資料之後,更新資料庫完成之前,這個時間段內如果有新的讀請求過來,就會從資料庫讀取舊資料重新寫到快取中,再次造成不一致,並且後續讀的都是舊資料。
2、先更新資料庫再刪除快取
進行更新操作時,先更新MySQL,成功之後,刪除快取,後續讀取請求時再將新資料回寫快取。
存在的問題:更新MySQL和刪除快取這段時間內,請求讀取的還是快取的舊資料,不過等資料庫更新完成,就會恢復一致,影響相對比較小。
3、非同步更新快取
資料庫的更新操作完成後不直接操作快取,而是把這個操作命令封裝成訊息扔到訊息佇列中,然後由Redis自己去消費更新資料,訊息佇列可以保證資料操作順序一致性,確保快取系統的資料正常。
快取穿透、快取雪崩、快取擊穿【詳解】Redis快取擊穿、穿透、雪崩概念及解決方案
快取穿透
快取穿透是指查詢一個不存在的資料,由於快取是不命中時被動寫的,如果從DB查不到資料則不寫入快取,這將導致這個不存在的資料每次請求都要到DB去查詢,失去了快取的意義。在流量大時,可能DB就掛掉了。
- 快取空值,不會查資料庫。
- 採用布隆過濾器,將所有可能存在的資料雜湊到一個足夠大的
bitmap
中,查詢不存在的資料會被這個bitmap
攔截掉,從而避免了對DB
的查詢壓力。
布隆過濾器的原理:當一個元素被加入集合時,通過K個雜湊函式將這個元素對映成一個位陣列中的K個點,把它們置為1。查詢時,將元素通過雜湊函式對映之後會得到k個點,如果這些點有任何一個0,則被檢元素一定不在,直接返回;如果都是1,則查詢元素很可能存在,就會去查詢Redis和資料庫。
快取雪崩
快取雪崩是指在我們設定快取時採用了相同的過期時間,導致快取在某一時刻同時失效,請求全部轉發到DB,DB瞬時壓力過重掛掉。
解決方法:在原有的失效時間基礎上增加一個隨機值,使得過期時間分散一些。
快取擊穿
快取擊穿:大量的請求同時查詢一個 key 時,此時這個 key 正好失效了,就會導致大量的請求都落到資料庫。快取擊穿是查詢快取中失效的 key,而快取穿透是查詢不存在的 key。
解決方法:加分散式鎖,第一個請求的執行緒可以拿到鎖,拿到鎖的執行緒查詢到了資料之後設定快取,其他的執行緒獲取鎖失敗會等待50ms然後重新到快取取資料,這樣便可以避免大量的請求落到資料庫。
public String get(String key) {
String value = redis.get(key);
if (value == null) {
//快取值過期
String unique_key = systemId + ":" + key;
//設定30s的超時
if (redis.set(unique_key, 1, 'NX', 'PX', 30000) == 1) { //設定成功
value = db.get(key);
redis.set(key, value, expire_secs);
redis.del(unique_key);
} else {
//其他執行緒已經到資料庫取值並回寫到快取了,可以重試獲取快取值
sleep(50);
get(key); //重試
}
} else {
return value;
}
}
pipeline的作用?
redis客戶端執行一條命令分4個過程:傳送命令、命令排隊、命令執行、返回結果。使用pipeline
可以批量請求,批量返回結果,執行速度比逐條執行要快。
使用pipeline
組裝的命令個數不能太多,不然資料量過大,增加客戶端的等待時間,還可能造成網路阻塞,可以將大量命令的拆分多個小的pipeline
命令完成。
原生批命令(mset和mget)與pipeline
對比:
- 原生批命令是原子性,
pipeline
是非原子性。pipeline命令中途異常退出,之前執行成功的命令不會回滾。 - 原生批命令只有一個命令,但
pipeline
支援多命令。
LUA指令碼
Redis 通過 LUA 指令碼建立具有原子性的命令:當lua指令碼命令正在執行的時候,不會有其他指令碼或 Redis 命令被執行,實現組合命令的原子操作。
在Redis中執行Lua指令碼有兩種方法:eval
和evalsha
。eval
命令使用內建的 Lua 直譯器,對 Lua 指令碼進行求值。
//第一個引數是lua指令碼,第二個引數是鍵名引數個數,剩下的是鍵名引數和附加引數
> eval "return {KEYS[1],KEYS[2],ARGV[1],ARGV[2]}" 2 key1 key2 first second
1) "key1"
2) "key2"
3) "first"
4) "second"
複製程式碼
lua指令碼作用
1、Lua指令碼在Redis中是原子執行的,執行過程中間不會插入其他命令。
2、Lua指令碼可以將多條命令一次性打包,有效地減少網路開銷。
應用場景
舉例:限制介面訪問頻率。
在Redis維護一個介面訪問次數的鍵值對,key
是介面名稱,value
是訪問次數。每次訪問介面時,會執行以下操作:
- 通過
aop
攔截介面的請求,對介面請求進行計數,每次進來一個請求,相應的介面訪問次數count
加1,存入redis。 - 如果是第一次請求,則會設定
count=1
,並設定過期時間。因為這裡set()
和expire()
組合操作不是原子操作,所以引入lua
指令碼,實現原子操作,避免併發訪問問題。 - 如果給定時間範圍內超過最大訪問次數,則會丟擲異常。
private String buildLuaScript() {
return "local c" +
"\nc = redis.call('get',KEYS[1])" +
"\nif c and tonumber(c) > tonumber(ARGV[1]) then" +
"\nreturn c;" +
"\nend" +
"\nc = redis.call('incr',KEYS[1])" +
"\nif tonumber(c) == 1 then" +
"\nredis.call('expire',KEYS[1],ARGV[2])" +
"\nend" +
"\nreturn c;";
}
String luaScript = buildLuaScript();
RedisScript<Number> redisScript = new DefaultRedisScript<>(luaScript, Number.class);
Number count = redisTemplate.execute(redisScript, keys, limit.count(), limit.period());
PS:這種介面限流的實現方式比較簡單,問題也比較多,一般不會使用,介面限流用的比較多的是令牌桶演算法和漏桶演算法。
作者:Dynasty
連結:juejin.cn/post/7019130513499619365
來源:稀土掘金
本作品採用《CC 協議》,轉載必須註明作者和本文連結