前言
快取要解決的問題是速度的問題,使用快取的目的是為了減少對物理資源的訪問,快取大量的應用在軟硬體的方方面面,從 CPU 到硬碟,就應用了 一級快取、二級快取,少部分快取記憶體和大量低速快取相結合,以提高 CPU 的計算能力,本文講的主要是系統整合專案中的軟體級別的快取。
快取因果圖
快取在現代系統中的位置可以說是舉足輕重,不是可有可無的問題了,而是怎麼樣用好的問題。怎麼樣講好快取這個話題,我思考了很久;如果是生搬硬套,我估計我肯定是涼涼,但要是上來就一頓程式碼操作,顯得字太多,各位看官老爺也是要噴死我的(你們噴我算我贏)。各位看官就當故事隨便看看就好了。
客戶端快取
小明同學是一個大學生,每個月都會從爸爸那裡領取生活費,由於爸爸給的生活費比較充裕,他就將一部分存了起來,周而復始,固定頻率,這就是瀏覽器網頁快取;有一天,他接到爸爸的一個電話,說每個月給現金,我總是從銀行拿也不方便,這樣,我們給存銀行卡里頭,但是說好了,每個月1號的時候轉1000塊進去,3號之前可以領取,過時不侯。這就是 Cookie!小明說爸,這時間太緊迫了,我萬一太過於專心學習忘記取錢那你兒子可是要餓死的吖,到時候沒人給你養老送終事兒就大了。他爸爸經過深思熟慮後,決定放開取現時間的限制:行,你想什麼時候取都成,就是別把卡給弄掉了就行。這就是LocalStorage/IndexDB,瀏覽器本地儲存。如果銀行卡掉了(瀏覽器重灌,刪庫跑路),那還得找爸爸。
伺服器快取
我們本次討論的重點就是伺服器快取,對於小明的爸爸來說,每次給小明生活費之前都要到銀行(資料庫)去取錢出來,實在是太麻煩,不如提前把錢取出來準備好,每次取半年的錢出來放家裡保險箱裡(快取),小明申請生活費的時候,直接給他就好了,節約時間效率又高,唯一的問題就是可能沒那麼安全,有可能被小偷把錢給偷了(快取更新),然後就是半年時間過後再重新取一筆出來(快取過期策略)。
靜態物件快取
靜態物件也是一種特殊的快取,靜態物件作用於程式的整個生命週期中。需要注意的是,靜態物件不會被 GC 回收 ,但是,如果靜態物件被多次引用覆蓋,那麼之前的引用就有可能被 GC 回收。這就好像,小明在向爸爸領取生活費的時候,發現這次領到手的錢實在是太破舊了,都不好意思花出去,爸爸只好重新給了另一份。
會話級快取
在 Web 站點中,Session 是私有制的,各個 Session 之間是不會共享記憶體物件的,我們可以利用這個特性(在Asp.NET 時代常用)來暫時儲存一些資料,例如使用者購物車。還是以小明的需求為例子,小明下面還有一個妹妹,妹妹每個月都可以從爸爸那裡多領取200元生活費,看到妹妹的資源這麼好,小明憤憤不平,就像妹妹提議共享生活費,一家人一起用,多好吖!結果小明被爸爸揍了一頓,還收回了部分生活費。
程式級別快取
基本上每個應用程式都具有本地快取的能力,在 Asp.NET 中就有 MemoryCache ,也叫做程式級快取(本地快取),MemoryCache 和 分散式快取的作用基本一致,所不同的是,本地快取在應用程式停止後就會被釋放掉,無法進行持久儲存。就好像,小明在上大學期間,每個月都是生活費的,但是到暑假的時候就沒有了(只能靠苦逼的暑期工掙點生活費啊)。
分散式快取
分散式快取是個好東西,目前市場上出現了非常多的 nosql 資料庫,都可用作快取資料庫,有時候,這些快取資料庫也提供持久化的能力。
小明家的生活條件,在經過爸爸的不懈努力之後,生活水平漸漸提高了;有一天,爸爸對小明說:明仔吖,我們們家現在生活水平提高了,但是爸爸也越來越忙了,這樣,如果我忙的時候,你問媽媽或者爺爺奶奶,也是可以拿到生活費的,我們們家這幾位長輩手裡都有錢了,這就是分散式快取。
但是分散式快取又分為主從模式和叢集模式,上面說的是叢集模式,爸爸媽媽爺爺奶奶都可以拿錢,但是主從模式就不同了,主從模式就是錢都在爸爸手裡,爸爸會把錢分給每個長輩一份,如果當時正好爸爸太忙了,沒來得及分給媽媽,而小明又恰好問媽媽要生活費的話;媽媽只能對他說:小命呀,不好意思,媽媽這裡也沒有,你看看再問問其它人(客戶端自己輪詢),在問了媽媽、爺爺後(引用指向),終於知道,錢在爸爸那裡,還得問爸爸要生活費。而且爸爸給其它人分錢的時候,還要佔用他工作的時間。
快取雪崩
快取雪崩就是在某一個時刻,大量的快取同時失效,造成資料庫訪問壓力倍增。小明的爸爸最近壓力比較大,因為收入減少了,他爸爸做的一個工程因為種種原因,貨款只能分期付清,為了防止小明和妹妹同時申請生活費,造成資金週轉困難;爸爸規定妹妹 1 號領取生活費,而小明在 5 號才能領取,小明心裡的苦啊!
快取穿透
快取穿透就是客戶端總是嘗試訪問某個不存在的快取,造成了每次都要取請求資料庫讀取資料。就好像小明吧,本來生活挺平靜的,這剛上大二,就交了個女朋友,每個月的 1000 元生活費有點捉襟見肘,然後他又不能讓爸爸知道,就在申請生活費的時候,每次都多要一點;這樣就搞得爸爸很被動,本來計劃得好好的,每個月都是 1000 塊,這沒次都不夠,老是要跑銀行取現金,終於在3個月後,爸爸發現了這個問題,想著兒子也大了,為了早日抱上孫子,就提高了小明的生活費,解決了每次都要跑銀行的問題。
快取擊穿
快取擊穿和快取雪崩有點類似,其中不同的是;快取雪崩是大量快取 key 同時過期,而快取擊穿是大量的請求指向同一個快取key,在這個 key 過期的時候,大量的請求湧入資料庫中,造成了瞬間巨大的壓力。舉個栗子,因為小明交了女朋友的原因,他的生活費總是很快用完了;這種情況下,他也必須在 1 號的時候拿到生活費,不然就要吃土了,但是媽媽不允許他們一起取打擾爸爸,媽媽就指定了妹妹去問,在妹妹沒有回來之前,小明只能等著,這就是為了解決快取擊穿而採用的策略:互斥鎖(mutex key)
運維級別快取
除了在應用程式中可以接入快取以外,部分運維工具也整合了快取服務,比如 Nginx、IIS。
代理快取
Nginx 就是反向代理快取,通過配置 Nginx 的快取功能,在客戶端請求到來到時候去載入快取內容,用以提高響應能力,IIS 快取又分為使用者快取和核心快取。IIS 的輸出快取設定中,核心模式快取不會對驗證等使用者資訊進行檢查,就好像小明等爸爸因為太趕時間,把錢放門衛大媽那裡了,結果隨便來了個學生就把小明等生活費給領走了,但是加上使用者模式快取後,就可以新增對身份的檢查(請求標頭),這樣大媽就會知道誰是小明而不會隨便把生活費交給別人了。
網頁靜態化
這種技術,在 Web1.0 時代非常的流行,我還記得那些個年頭的網站開發專案中的要求,大部分專案的需求分析文件裡面就明晃晃的寫著:網頁靜態化!,而靜態化常見於各種企業型、論壇帖子,在發表這些資訊後就將其生成靜態網頁,客戶端訪問的時候,直接重定向到該靜態網頁,基本無需訪問資料庫。
CDN 快取
CDN 快取類似於上面提到的分散式快取,但是實際上 CDN 快取服務目前來說,主要說針對靜態資源的,比如圖片、視訊、檔案等等;大家經常可以看到,很多站點都號稱提供了 CDN 加速服務,這些站點就像一個個代辦信用卡的銷售中介,實際上拿的都是銀行的資源。
更形象一些的說法,就是大家的錢都是中國人民銀行發行的,我們可以通過各個不同的銀行(CDN節點)查詢我們的銀行卡餘額(我怎麼可能有餘額),在以前沒有手機銀行的時候,大家就可以到附近的銀行去查詢,然後取款(CDN快取),如果附近的銀行的櫃員機沒有現金,那麼可能就需要到總行去取了(回源),如果發生了太多回源的事件,就會造成 CDN 的擁堵,所以 CDN 服務商也不敢打包票自己的基礎服務沒有問題,反正我是沒見到哪家 CDN 服務商敢註明服務穩定性 100%,基本上都是 99.99%
結束語
快取的理論知識,其實是非常巨集大的,我這裡只是拋磚引玉,希望能給入門的朋友帶來一點幫助,如果你喜歡這篇文章,請給我點贊,讓更多同學可以看到。