一、 Redis官方推薦叢集方案:Redis Cluster
適用於redis3.0以後版本,
Redis群集資料分片
· Redis Cluster不使用一致的雜湊,而是使用不同形式的分片,其中每個鍵稱之為 hash slot.。
Redis叢集中有16384個雜湊槽,為了計算給定金鑰的雜湊槽,我們只需採用金鑰模數16384的CRC16。
Redis群集中的每個節點都負責雜湊槽的子集,例如,擁有一個包含3個節點的叢集,其中:
- 節點A包含從0到5500的雜湊槽。
- 節點B包含從5501到11000的雜湊槽。
- 節點C包含從11001到16383的雜湊槽。
這允許輕鬆新增和刪除叢集中的節點。例如,如果我想新增一個新節點D,我需要將一些雜湊槽從節點A,B,C移動到D.同樣,如果我想從群集中刪除節點A,我只需移動A服務的雜湊槽。到B和C.當節點A為空時,我可以完全從叢集中刪除它。
因為將雜湊槽從一個節點移動到另一個節點不需要停止操作,新增和刪除節點,或者更改節點所持有的雜湊槽的百分比,所以不需要任何停機時間。
只要涉及單個命令執行(或整個事務或Lua指令碼執行)的所有鍵都屬於同一個雜湊槽,Redis Cluster就支援多個鍵操作。使用者可以通過使用稱為雜湊標記的概念強制多個金鑰成為同一雜湊槽的一部分。
Hash標籤記錄在Redis叢集規範中,但要點是如果金鑰中{}括號之間有子字串,則只對字串內部的內容進行雜湊處理,例如this{foo}key
並another{foo}key
保證位於相同的雜湊槽中,並且可以在具有多個鍵作為引數的命令中一起使用。
Redis Cluster主從模型
為了在主節點子集發生故障或無法與大多數節點通訊時保持可用,Redis Cluster使用主從模型,其中每個雜湊槽從1(主機本身)到N個副本(N) -1個額外的從節點)。建立叢集時,每個主節點新增一個從節點,以便最終叢集由作為主節點的A,B,C和作為從節點的A1,B1,C1組成。如果節點B出現故障,系統就能繼續執行。節點B1複製B,B失敗,叢集將節點B1升級為新的主節點,並將繼續正常執行。
注意,如果節點B和B1同時發生故障,Redis Cluster將無法繼續執行。
Redis群集一致性保證
Redis Cluster無法保證強一致性。在某些條件下,Redis Cluster可能會丟失系統向客戶端確認的寫入。
Redis Cluster可能丟失寫入的第一個原因是它使用非同步複製。這意味著在寫入期間會發生以下情況:
- 客戶端寫入master B.
- master B向客戶端回覆確定。
- master B將寫入傳播到其從裝置B1,B2和B3。
(1)B在回覆客戶端之前並沒有等待來自B1,B2,B3的確認,因為這對Redis來說是一個過高的延遲,所以如果客戶端寫了一些東西,B會確認寫入,但是在崩潰之前能夠將寫入傳送到其slave,其中一個slave(沒有接收到寫入)被提升為master ,永遠丟失寫入。
這與大多數資料庫配置為每秒將資料重新整理到磁碟的所發生的情況非常相似。同樣,可以通過在回覆客戶端之前強制資料庫重新整理磁碟上的資料來提高一致性,但會導致效能過低。在Redis Cluster情況下,相當於同步複製。
解決辦法,即需要在效能和一致性之間進行權衡。
Redis Cluster在絕對需要時支援同步寫入,通過WAIT命令實現,這使得丟失寫入的可能性大大降低,但即使使用同步複製,Redis Cluster也不會實現強一致性:在更復雜的情況下總是可以實現失敗場景,無法接收寫入的slave被選為master。
(2)還有另一個值得注意的情況是,Redis叢集將丟失寫入,這種情況發生在網路分割槽中,其中客戶端與少數例項(至少包括主伺服器)隔離。如,
以6個節點簇為例,包括A,B,C,A1,B1,C1,3個主站和3個從站。還有一個客戶,我們稱之為Z1。
在發生分割槽之後,可能在分割槽的一側有A,C,A1,B1,C1,在另一側有B和Z1。
Z1仍然可以寫入B,它將接受其寫入。如果分割槽在很短的時間內恢復,叢集將繼續正常執行。但是,如果分割槽持續足夠的時間使B1在分割槽的多數側被提升為主,則Z1傳送給B的寫入將丟失。
注意,Z1將能夠傳送到B的寫入量存在maximum window:如果分割槽的多數方面已經有足夠的時間將slave選為master,則少數端的每個主節點都會停止接受寫入。
這段時間是Redis Cluster的一個非常重要的配置指令,稱為節點超時。
節點超時過後,master被視為失敗,可以由其中一個副本替換。類似地,在節點超時已經過去而主節點無法感知大多數其他主節點之後,它進入錯誤狀態並停止接受寫入。
2):如果一個例項(instance)距離最後一次有效回覆 PING 命令的時間超過 down-after-milliseconds 選項所指定的值, 則這個例項會被 Sentinel 標記為主觀下線。
3):如果一個Master被標記為主觀下線,則正在監視這個Master的所有 Sentinel 要以每秒一次的頻率確認Master的確進入了主觀下線狀態。
4):當有足夠數量的 Sentinel(大於等於配置檔案指定的值)在指定的時間範圍內確認Master的確進入了主觀下線狀態, 則Master會被標記為客觀下線
5):在一般情況下, 每個 Sentinel 會以每 10 秒一次的頻率向它已知的所有Master,Slave傳送 INFO 命令
6):當Master被 Sentinel 標記為客觀下線時,Sentinel 向下線的 Master 的所有 Slave 傳送 INFO 命令的頻率會從 10 秒一次改為每秒一次
7):若沒有足夠數量的 Sentinel 同意 Master 已經下線, Master 的客觀下線狀態就會被移除。
若 Master 重新向 Sentinel 的 PING 命令返回有效回覆, Master 的主觀下線狀態就會被移除。
主從複製:主節點負責寫資料,從節點負責讀資料,主節點定期把資料同步到從節點保證資料的一致性
備註:主從複製和哨兵機制需要進行手動配置。
三、Redis作為快取應用問題及解決方案:
1)快取穿透
-
對所有可能查詢的引數以hash形式儲存,在控制層先進行校驗,不符合則丟棄。還有最常見的則是採用布隆過濾器,將所有可能存在的資料雜湊到一個足夠大的bitmap中,一個一定不存在的資料會被這個bitmap攔截掉,從而避免了對底層儲存系統的查詢壓力。
-
也可以採用一個更為簡單粗暴的方法,如果一個查詢返回的資料為空(不管是資料不存在,還是系統故障),我們仍然把這個空結果進行快取,但它的過期時間會很短,最長不超過五分鐘。
2)快取雪崩
-
在快取失效後,通過加鎖或者佇列來控制讀資料庫寫快取的執行緒數量。比如對某個key只允許一個執行緒查詢資料和寫快取,其他執行緒等待。
-
可以通過快取reload機制,預先去更新快取,再即將發生大併發訪問前手動觸發載入快取
-
不同的key,設定不同的過期時間,讓快取失效的時間點儘量均勻. 比如我們可以在原有的失效時間基礎上增加一個隨機值,比如1-5分鐘隨機,這樣每一個快取的過期時間的重複率就會降低,就很難引發集體失效的事件
-
做二級快取,或者雙快取策略。A1為原始快取,A2為拷貝快取,A1失效時,可以訪問A2,A1快取失效時間設定為短期,A2設定為長期。
3)快取擊穿
4)快取預熱
-
直接寫個快取重新整理頁面,上線時手工操作下;
-
資料量不大,可以在專案啟動的時候自動進行載入;
-
定時重新整理快取;
5)快取更新
-
定時去清理過期的快取;
-
當有使用者請求過來時,再判斷這個請求所用到的快取是否過期,過期的話就去底層系統得到新資料並更新快取。
6)快取降級
-
一般:比如有些服務偶爾因為網路抖動或者服務正在上線而超時,可以自動降級;
-
警告:有些服務在一段時間內成功率有波動(如在95~100%之間),可以自動降級或人工降級,併傳送告警;
-
錯誤:比如可用率低於90%,或者資料庫連線池被打爆了,或者訪問量突然猛增到系統能承受的最大閥值,此時可以根據情況自動降級或者人工降級;
-
嚴重錯誤:比如因為特殊原因資料錯誤了,此時需要緊急人工降級。
四、redis作為分散式鎖方案(效能最優)
分散式鎖是控制分散式系統之間同步訪問共享資源的一種方式。
實現思路:
- 使用
SETNX
命令獲取鎖,若不存在則設定值,設定成功則表示取得鎖成功; - 設定expire,保證超時後能自動釋放鎖(使用lua指令碼將setnx和expire變成一個原子操作);
- 釋放鎖,使用
DEL
命令將鎖資料刪除。