超高併發下，Redis熱點資料風險破解

Hello-Brand發表於2024-03-21

原文網址 : https://www.cnblogs.com/wzh2010/p/18030929

★ Redis24篇集合

1 介紹

作者是網際網路一線研發負責人，所在業務也是業核心心流量來源，經常參與業務預定、積分競拍、商品秒殺等工作。
近期參與多場新員工的面試工作，經常就 『超高併發場景下熱點資料』 可用性保障與候選人進行討論。
本文聚焦一些關鍵點技術進行討論，並總結一些熱點場景的處理經驗。

2 業務基礎架構簡圖（假設）

3 超高併發下熱點資料的穩定性保障

3.1 命題背景

1000w+請求同時投向後端，如果快取未建立、失效，甚至快取服務故障，就會透過快取層直接投向資料庫。
可能會造成整體擊穿/雪崩，怎麼破？

3.2 各種業務場景及應對方案

3.2.1 規律性熱點資料預熱

無論是聚集式熱key，還是雜湊式熱key，只要是有一定規律性的，均可以做預熱。
既然是熱Key，那就想辦法儘可能讓它不進入MySQL，就不會對資料庫造成傷害,。
這種場景最常見的就是對一些字典資料做預熱，因為他們不容易改變，修改頻次較低，但又很容易在高峰期被群蜂請求（突發式的批次請求）。
電商領域比如：商品種類、品牌型別、折扣規則。
辦公/教學領域比如：學校、年段、班級、學科、考試科目等。

一般來說如果10點是峰值期，那麼可以預先在8~10點期間，可以逐漸的把大部分快取建立起來。如圖：

3.2.2 非規律性熱點資料預熱

Redis + 應用層加探測器，預判熱Key，並將探測到的熱Key進行預熱。
1、baidu實時熱搜

2. taobao商品排行

這種額外的開銷就是有一個實時計算的獨立元件，因為熱點新聞、熱點資料都有急劇突變的特性。比如weibo多次因為突發熱點新聞導致網站崩潰。

3.2.3 破解過期時間一致性問題

快取的建立過程都是雜湊的，但是如果長時間靜待都會被逐漸釋放。
比如釘釘、飛書的辦公場景，遇到夜晚低峰期、週末節假日，快取Key被逐步釋放之後。很容易在第二個工作日的早高峰造成大量建立快取，流量井噴。
解決方案除了前面我們提到的快取預熱之外，錯峰過期時間也是常規操作。
可以給快取設定過期時間時加上一個隨機值時間，使得每個key的過期時間分佈開來，不會集中在同一時刻失效。
隨機值我們團隊的做法是：n * 3/4 + n * random() 。所以，比如你原本計劃對一個快取建立的過期時間為8小時，那就是6小時 + 0~2小時的隨機值。
這樣保證了均勻分佈在 6~8小時之間。如圖：

3.2.4 過濾垃圾請求

一般情況下，我們取數先從快取中Get Key，不存在的時候再從資料庫中去獲取，但這很容易給攻擊者提供漏洞。
他可以瘋狂模擬一些不存在的Key，讓你進入資料庫去取數，這樣就可以拖垮你的資料庫，實現擊潰你係統的目的。
有效的辦法是在服務層先判斷這個Key的是否符合標準（比如滴滴的訂單資料快取包含時間戳+使用者ID的序列化），這樣可以過濾一部分無效攻擊。
但是如果他能夠破解你key的規則，依舊可以鑽漏洞。你可以在快取層上加一層過濾器，幫你Filter掉那些不合理的攻擊。
詳細可以參考我這篇《Redis系列16：聊聊布隆過濾器（原理篇）》

3.2.5 訊息佇列和削峰

如果一個快取不存在（不存在、過期、被誤刪都有可能），但是同時有千萬請求投奔過來。
這時候關心是不是及時拿回正確資料已經不重要了，保住你的快取和資料庫不被擊穿才是關鍵。
佇列的目的是讓並行變成序列，這一定程度上降低系統處理使用者請求的吞吐能力，但是卻能很好的緩解你服務的壓力和風險。

如上圖：第一個請求B從資料庫中取，後面的C、A就是從快取服務中取了，壓力變小很多。

3.2.6 適當加鎖

分散式鎖場景，在訪問key之前，採用SETNX（set if not exists）來設定另一個短期key來鎖住當前key的訪問，訪問結束再刪除該短期key。
這種現象是多個執行緒同時去查詢資料庫的這條資料，那麼我們可以在第一個查詢資料的請求上使用一個互斥鎖來鎖住它。
其他的執行緒走到這一步拿不到鎖就等著，等第一個執行緒查詢到了資料，然後做快取。後面的執行緒進來發現已經有快取了，就直接走快取。
鎖不好的地方就是在其他執行緒在拿不到鎖的時候就等待，這個會造成系統整體吞吐量降低，使用者體驗度也不好。
這算是一種簡單明瞭的降級策略了。

3.2.7 限流策略

一樣是一種在流量井噴時保住服務不雪崩的有效方法，限流一般是從服務層去實現的。
Java服務的話可以使用 Hystrix進行限流 + 降級，比如一下子來了1W個請求，超過當前系統的吞吐承受能力，假設單秒TPS的能力只能是 5000個，那麼剩餘的 5000 請求就可以走限流邏輯。
可以設定一些預設值，然後呼叫我們自己降級邏輯去FallBack，保護最後的 MySQL 不會被大量的請求掛起。除了Hystrix之外，阿里的Sentinel 和 Google的RateLimiter 都是不錯的選擇。
Sentinel 漏桶演算法

RateLimiter 令牌桶演算法

3.2.8 降級策略(備選快取)

你的快取層存在主備場景，他們之間定時非同步同步，所以允許存在短暫資料不一致的情況。
當你的主服務掛了之後，降級去讀備服務，資料時效性沒那麼高，但是也避免了資料庫被打穿的情況發生。

3.2.9 降級策略（客戶端快取）

參考Redis 6.0的 Client Side Cache，看我這篇《追求效能極致：客戶端快取帶來的革命》。
類似4.5做法，客戶端快取時效性會差一點，畢竟存在訂閱跟同步的過程，資料沒那麼新。但是避免大量的請求直接上快取服務，又因無效的快取服務又把壓力轉移給資料庫。

3.2.10 降級策略之空初始值

這是一種短效的降級方式：
如果一個快取失效的時候，有無數個請求狂奔而來，而第一個請求從進入快取池，判空，再到資料庫檢索，再查詢出結果並返回設定快取的這個過程裡，快取是不存在的。
這個就很危險，超高併發下這個短暫的過程足已讓千千萬萬請求投向資料庫。更別提這可能是個慢查詢，整個過程可能長達2s以上，那對資料庫是一種非常大的傷害。
業內有一種做法叫做空初始值，短暫的區域性降級來保證整個資料庫系統不被擊穿。大概流程如下：

可以看出，整個過程中我們犧牲了A、B、C、D的請求，他們拿回了一個空值或者預設值，但是這區域性的降級卻保證整個資料庫系統不被擁堵的請求擊穿。

3.2.11 高可用叢集和自動擴縮容

叢集模式和自動擴縮容模式從服務到快取到資料層都應該具備，否則無法根據流量來進行彈性伸縮，保持高可用。
如下圖，藍色部件是擴容的部分，每一分層都有自己的動態擴容機制。

詳細可以參考筆者這幾篇文章。
《雲原生：使用HPA和VPA實現叢集擴縮容》
《資料庫系列：資料庫高可用及無損擴容》

3.2.12 雪崩之後的恢復

如果最終導致了快取雪崩，那麼重啟後快速的資料恢復也是我們核心的目標。
剛剛恢復重啟的快取服務，這時候資料都是空的，大量的請求流量帶來的快取重建（進而拉動資料庫流量）勢必會帶來壓力甚至二次雪崩。
這時候最好的辦法就是能夠有工具進行快取恢復，而不是從資料庫中去獲取資料來重建，這樣的過程漫長而負重。
這塊可以參考筆者的這兩篇文章：
《Redis系列：RDB記憶體快照提供持久化能力》
《Redis穩定性之戰：AOF日誌支撐資料持久化》

4 總結

擴充套件閱讀：快取雪崩、擊穿、穿透
《架構與思維：一次快取雪崩的災難覆盤》
《架構與思維：再聊快取擊穿，面試是一場博弈》

小工匠聊架構-超高併發秒殺系統設計 03_熱點資料的處理
2020-10-19
架構
實時資料併發寫入 Redis 優化
2019-11-12
Redis優化
如何解決 Redis 資料傾斜、熱點等問題
2022-12-13
Redis
縣域醫共體下的資料安全風險與治理
2020-09-23
高併發下使用Redis悲觀鎖解決資料二次寫入
2020-11-17
Redis
『研究發現多喝“熱水”可能會增加食管癌風險』今日資料行業日報（2018.03.12）
2018-03-12
行業
淘寶二面：千萬級資料中如何用Redis維護熱點資料"？
2024-06-20
Redis
大會資料下載｜熱門技術風口下開發者應該關注些什麼？
2019-05-06
Redis熱點key大key
2024-05-08
Redis
RSA創新沙盒盤點 |Deduce——資料驅動的身份欺詐風險
2021-05-16
如何消除冗餘資料的安全風險？
2019-04-09
資料庫系列：高併發下的資料欄位變更
2022-05-31
資料庫
遊戲開發者熱議：生成式AI的潛力和風險
2023-02-20
遊戲開發AI
資料庫系列：InnoDB下實現高併發控制
2023-11-07
資料庫
高併發下如何避免產生重複資料？
2022-06-13
2021年全球風險展望：明確存在的危險，0-2年短期風險（附原資料表）
2021-01-26
熱點資料和冷資料是什麼?
2020-12-12
您的資料安全嗎？如何評估和降低資料風險
2021-08-30
極光大資料：2018春節期間熱點app資料觀察（附下載）
2018-03-09
大資料APP
ACS：研究發現烘焙甜點中的巧克力暗藏健康風險
2024-06-02
淘寶二面：MySQL裡有2000萬條資料，但是Redis中只存20萬的資料，如何保證redis中的資料都是熱點資料?
2024-04-15
MySqlRedis
tiktok實時熱點資料分析
2021-09-26
《網路空間測繪年報》|從安全事件透析網路空間資產安全熱門風險點
2022-01-25
事件
巨量算數：2022抖音熱點資料包告（附下載）
2023-02-06
【資料庫】併發控制
2018-06-01
資料庫
破解分散式庫使用難點：資料分片策略
2023-12-01
分散式
併發場景下資料寫入功能的實現
2022-05-26
微服務 - Redis快取 · 資料結構 · 持久化 · 分散式 · 高併發
2023-04-18
微服務Redis快取資料結構持久化分散式
中文Redis Desktop Manager 啟用資源「rdm mac破解版下載」
2023-11-01
RedisMac
網站安全公司講解資料安全風險分析
2020-08-04
網站
資料專案風險-都在為別人著想
2022-01-04
[分散式][高併發]熱點快取的架構優化
2019-02-21
分散式快取架構優化
Redis-高併發篇
2018-05-26
Redis
Redis如何防止高併發?
2024-04-10
Redis
Redis 實現高併發下的搶購 / 秒殺功能
2020-03-15
Redis
Crunchbase：2019 Q2 各階段風險投資資料
2019-08-03
減輕敏捷實戰中故事點發生漂移的風險 - modernanalyst
2020-04-19
敏捷NaN
開放銀行是銀行4.0起點存在資料洩露等四種風險
2019-06-30