給資料庫減負刻不容緩：多級快取設計

獵手家園發表於2018-12-26

　　自古兵家多謀，《謀攻篇》，“故上兵伐謀，其次伐交，其次伐兵，其下攻城。攻城之法，為不得已”，可見攻城之計有很多種，而爬牆攻城是最不明智的做法，軍隊疲憊受損、錢糧損耗、百姓遭殃。故而我們有很多迂迴之策，謀略、外交、軍事手段等等，每一種都比攻城的代價小，更輕量級，快取設計亦是如此。

一、為什麼要設計快取呢？
　　其實高併發應對的解決方案不是網際網路獨創的，計算機先祖們很早就對類似的場景做了方案。比如《計算機組成原理》這樣提到的cpu快取概念，它是一種快取記憶體，容量比記憶體小但是速度卻快很多，這種快取的出現主要是為了解決cpu運算速度遠大於記憶體讀寫速度，甚至達到千萬倍。

　　傳統的cpu透過fsb直連記憶體的方式顯然就會因為記憶體訪問的等待，導致cpu吞吐量下降，記憶體成為效能瓶頸。同時又由於記憶體訪問的熱點資料集中性，所以需要在cpu與記憶體之間做一層臨時的儲存器作為快取記憶體。

　　隨著系統複雜性的提升，這種快取記憶體和記憶體之間的速度進一步拉開，由於技術難度和成本等原因，所以有了更大的二級、三級快取。根據讀取順序，絕大多數的請求首先落在一級快取上，其次二級...

　　故而應用於SOA甚至微服務的場景，記憶體相當於儲存業務資料的持久化資料庫，其吞吐量肯定是遠遠小於快取的，而對於java程式來講，本地的jvm快取優於集中式的redis快取。

　　關係型資料庫操作方便、易於維護且訪問資料靈活，但是隨著資料量的增加，其檢索、更新的效率會越來越低。所以在高併發低延遲要求複雜的場景，要給資料庫減負，減少其壓力。

二、給資料庫減負
1、快取分散式，做多級快取

2、讀請求時寫快取
寫快取時一級一級寫，先寫本地快取，再寫集中式快取。具體些快取的方法可以有很多種，但是需要注意幾項原則：
　　（1）不要複製貼上，避免重複程式碼；
　　（2）切忌和業務耦合太緊，不利於後期維護；
　　（3）開發初期剛剛上線階段，為了排查問題，常常會給快取設定開關，但是開關設定多了則會同時升高系統的複雜度，需要結合一套統一配置管理系統，京東物流有一套叫做UCC......

綜上所述，高耦合帶來的痛，彌補的代價是很大的，所以可以借鑑Spring cache來實現，實現也比較簡單，使用時一個註解就搞定了。

3、寫快取失敗了怎麼辦？應該先寫快取還是資料庫呢？
既然是快取的設計，那麼策略一定是保證最終一致性，那麼我們只需要採用非同步訊息來補償就好了。

大部分快取應用的場景是讀寫比差異很大的，讀遠大於寫，在這種場景下，只需要以資料庫為主，先寫資料庫，再寫快取就好了。

最後補充一點，資料庫出現異常時，不要一股腦的catch RuntimeException，而是把具體關心的異常往外拋，然後進行有針對性的異常處理。

4、關於其他效能方面
快取設計都是佔用越少越好，記憶體資源昂貴以及太大不好維護都驅使我們這樣設計。所以要儘可能減少快取不必要的資料，有的同學圖省事把整個物件序列化儲存。另外，序列化與反序列化也是消耗效能的。

5、vs各種快取同步方案
快取同步方案有很多種，在考慮一致性、資料庫訪問壓力、實時性等方面做權衡。總的來說有以下幾種方式：

（1）懶載入式
如上段提到的方式，讀時順便載入。為了更新快取資料，需要過期快取。

優點：簡單直接
缺點：
會造成一次快取不命中，這樣當使用者併發很大時，恰好快取中無資料，資料庫承擔瞬時流量過大會造成風險。

懶載入式太簡單了，沒有自動載入，非同步重新整理等機制，為了彌補其缺陷，請參見接下來的兩種方法。

（2）補充式
可以在快取時，把過期時間等資訊寫到一個非同步佇列裡，後臺起個執行緒池定期掃描這個佇列，在快過期時主動reload快取，使得資料會一直保持在快取中，如果快取沒有也沒有必要去資料庫查詢了。常見的處理方式有使用binlog加工成訊息供增量處理。

優點：重新整理快取變為非同步的任務，對資料庫的壓力瞬間由於任務佇列的介入而降低了，削平併發的波峰。
缺點：訊息一旦積壓會造成同步延遲，引入複雜度。

（3）定時載入式
這就需要有個非同步執行緒池定期把資料庫的資料刷到集中式快取，如redis裡。

優點：保證所有資料最小時間差同步到快取中，延遲很低。
缺點：如補充式，需要一個任務排程框架，複雜度提升，且要保證任務的順序。如果遞進一步還想載入到本地快取，就得本地應用自己起執行緒抓取，方案維護成本高。可以考慮使用mq或者其他非同步任務排程框架。
ps：為了防止佇列過大排程出現問題，處理完的資料要儘快結轉，且要對積壓資料以及寫入情況做監控。

6、防止快取穿透
　　快取穿透是指查詢的key壓根不存在，從而快取查詢不到而查詢了資料庫。若是這樣的key恰好併發請求很大，那麼就會對資料庫造成不必要的壓力。怎麼解決呢？
把所有存在的key都存到另外一個儲存的Set集合裡，查詢時可以先查詢key是否存在。

　　乾脆簡單一些，給查詢不到的key也加一個標識空值的Value，這樣就不會去查詢資料庫了，比如場景為查詢省市區街道對應的移動營業廳，若是某街道確實沒有移動營業廳，key規則不變，value可以設定為"0"等無意義的字元。當然此種方案要保證快取叢集的高可用。這些Key可能不是永遠不存在，所以需要根據業務場景來設定過期時間。

7、熱點快取與快取淘汰策略
有一些場景，需要只保持一部分的熱點快取，不需要全量快取，比如熱賣的商品資訊，購買某類商品的熱門商圈資訊等等。

綜合來講，快取過期的策略有以下三種：

（1）FIFO（First In，First Out）
先進先出，淘汰最早進來的快取資料，一個標準的佇列。

以佇列為基本資料結構，從隊首進入新資料，從隊尾淘汰。

（2）LRU（Least RecentlyUsed）
最近最少使用，淘汰最近不使用的快取資料。如果資料最近被訪問過，則不淘汰。

　　A、和FIFO不同的是，需要對連結串列做基本模型，讀寫的時間複雜度是O（1），寫入新資料進入頭部，連結串列滿了資料從尾部淘汰；
　　B、最近時間被訪問的資料移動到頭部，實現演算法有很多，如hashmap+雙向連結串列等等；
　　C、問題在於若是偶發性某些key被最近頻繁訪問，而非常態，則資料受到汙染。

（3）LFU（Least Frequently used）
最近使用次數最少的資料被淘汰，注意和LRU的區別在於LRU的淘汰規則是基於訪問時間。

　　A、LFU中的每個資料塊都有一個引用計數，資料塊按照引用計數排序，若是恰好具有相同引用計數的資料塊則按照時間排序；
　　B、因為新加入的資料訪問次數為1，所以插入到佇列尾部；
　　C、佇列中的資料被新訪問後，引用計數增加，佇列重新排序；
　　D、當需要淘汰資料時，將已經排序的列表最後的資料塊刪除；
　　E、有很明顯問題是若短時間內被頻繁訪問多次，比如訪問異常或者迴圈沒有控制住，而後很長時間未使用，則此資料會因為頻率高而被錯誤的保留下來沒有被淘汰。尤其對於新來的資料，由於其起始的次數是1，所以即便被正常使用也會因為比不過老的資料而被淘汰。所以維基百科說純粹的LFU演算法不經常單獨使用而是組合在其他策略中使用。

8、快取使用的一些常見問題：
Q：那麼應該選擇用本地快取（local cache）還是集中式快取（Cache cluster）呢?
A：首先看資料量，看快取更新的成本，如果整體快取資料量不是很大，而且變化的不頻繁，那麼建議本地快取。

Q：怎麼批次更新一批快取資料？
A：依次從資料庫讀取，然後批次寫入快取，批次更新，設定版本過期key或者主動刪除。

Q：如果不知道有哪些key怎麼定期刪除？
A：拿redis來說keys * 太損耗效能，不推薦。可以指定一個集合，把所有的key都存到這個集合裡，然後對整個集合進行刪除，這樣便能完全清理了。

Q：一個key包含的集合很大，redis無法做到記憶體空間上的均勻Shard?
A：1、可以簡單的設定key過期，這樣就要允許有快取不命中的情況；2、給key設定版本，比如為兩天後的當前時間，然後讀取快取時用時間判斷一下是否需要重新載入快取，作為版本過期的策略。

資料庫減負刻不容緩？多級快取設計瞭解一下！
2018-08-02
資料庫快取
巧妙設計多級快取，為資料庫減負
2018-08-19
快取資料庫
密碼立法：保障資訊保安刻不容緩
2019-10-30
密碼
NSA：對於量子計算，佈防刻不容緩
2018-05-02
瞭解 “MAC 地址隨機化” 刻不容緩
2022-02-25
Mac隨機
華為供應鏈“限制升級”，國產晶片突圍刻不容緩
2020-05-19
晶片
服裝企業的生產管理刻不容緩
2021-11-17
Java中的多級快取設計與實現
2024-07-20
Java快取
刻不容緩，虛假訊息之戰何時休？
2018-06-07
刻不容緩騰訊雲雙十一活動羊毛攻略!!!
2024-11-08
安全刻不容緩「GitHub 熱點速覽 v.21.50」
2021-12-13
Github
專案中多級快取設計實踐總結
2023-03-08
快取
2019年國內外資料洩露事件盤點——個人資訊保護刻不容緩
2020-01-13
事件
快取架構設計細節二三事--究竟先操作快取，還是資料庫？
2018-10-29
快取架構資料庫
中小型企業上線OA系統刻不容緩
2020-02-03
使用 Infinispan 快取功能支援多個 Redis 資料庫
2024-11-14
快取Redis資料庫
資料中心火災防護刻不容緩，巴黎聖母院大火就是例子！
2019-04-24
2020國家網安周：建立開放協作的資料流動規則刻不容緩
2020-09-15
再損失6600萬美金，強化企業資訊保安保障刻不容緩
2020-06-23
分享：如何給 DBA 減負？
2023-03-31
網校原始碼：提供網校系統搭建服務刻不容緩！
2021-02-21
原始碼
k05_多級快取
2024-03-11
快取
多級快取架構（六）
2021-07-04
快取架構
資料安全刻不容緩，國產智慧化廠商首獲SOC 2鑑證報告有何意義?
2022-06-09
Python操作Redis快取資料庫
2019-05-13
PythonRedis快取資料庫
快取淘汰、快取穿透、快取擊穿、快取雪崩、資料庫快取雙寫一致性
2019-04-28
快取穿透資料庫
【資料庫設計】資料庫的設計
2018-06-21
資料庫
又一非法採集人臉資訊企業被查處！人臉資訊保護刻不容緩
2021-07-14
Redis快取資料庫-快速入門
2023-03-08
Redis快取資料庫
億級系統的Redis快取如何設計？？？
2023-03-01
Redis快取
“九”答不可|為什麼發展量子金鑰技術已刻不容緩？
2018-05-03
ssl加密證書鏈是什麼?有啥用?網路安全刻不容緩
2022-05-11
加密
使用Redis和Java進行資料庫快取 - DZone資料庫
2019-04-18
RedisJava資料庫快取
MyBatis快取機制（一級快取，二級快取）
2020-05-20
MyBatis快取
OpenResty+lua+redis+mysql多級快取
2021-05-14
RESTRedisMySql快取
分散式快取--快取與資料庫一致性方案
2022-04-11
分散式快取資料庫
究竟先操作快取，還是資料庫？
2018-11-06
快取資料庫
微博關閉造謠賬號：打擊造謠自媒體刻不容緩
2021-05-23

給資料庫減負刻不容緩：多級快取設計

相關文章