memcached 分散式實現原理

Float_Lu發表於2016-05-20

摘要

在高併發環境下，大量的讀、寫請求湧向資料庫，此時磁碟IO將成為瓶頸，從而導致過高的響應延遲，因此快取應運而生。無論是單機快取還是分散式快取都有其適應場景和優缺點，當今存在的快取產品也是數不勝數，最常見的有redis和memcached等，既然是分散式，那麼他們是怎麼實現分散式的呢？本文主要介紹分散式快取服務mencached的分散式實現原理。

快取本質

計算機體系快取

什麼是快取，我們先看看計算機體系結構中的儲存體系，根據馮·諾依曼計算機體系結構模型，計算機分為五大部分：運算器、控制器、儲存器、輸入裝置、輸出裝置。結合現代計算機，CPU包含運算器和控制器兩個部分，CPU負責計算，其需要的資料由儲存提供，儲存分為幾個級別，就拿我當前的PC舉個例子，我的機器儲存清單如下：

356G的磁碟
4G的記憶體
3MB三級快取
256KB二級快取(pre core)

除了上述部分，還有CPU內的暫存器，當然有的計算機還有一級快取等。CPU運算器工作的時候需要資料，資料哪裡來？首先從距離CPU最近的二級快取去拿，這塊快取速度最快，通常也是體積最小，因為價格最貴：

儲存金字塔

如上圖所示，儲存體系就像個金子塔，最上層最快，價格最貴，最下層最慢，價格也最便宜，CPU的資料來源優先順序一層層從上到下去尋找資料。

很顯然，除了最慢的那塊儲存，在計算機體系中，相對較快的那些儲存都可以被稱為快取，他們解決的問題是讓儲存訪問更快。

快取應用系統

計算機體系儲存系統模型擴充套件到應用也是一樣，應用需要資料，資料哪裡來？快取(更快的儲存)->DB（較慢的儲存），他們的工作流程大致如下圖所示：

帶快取的儲存訪問一般模型

如上圖所示，快取應用系統一般儲存訪問流程：首先訪問快取較快的儲存介質，如果命中且未失效則返回內容，如果未命中或失效則訪問較慢的儲存介質將內容返回同時更新快取。

memcached簡介

什麼是memcached

memcached是LiveJournal旗下的Danga Interactive公司的Brad Fitzpatric為首開發的一款軟體。現在已經成為mixi、hatena、Facebook、Vox、LiveJournal等眾多服務中提高Web應用擴充套件性的重要因素。傳統的Web應用都將資料儲存到RDBMS中，應用伺服器從RDBMS中讀取資料、處理資料並在瀏覽器中顯示。但是隨著資料量增大、訪問的集中、就會出現RDBMS的負擔加重、資料庫響應變慢、導致整個系統響應延遲增加。

而memcached就是為了解決這個問題而出現的，memcached是一款高效能的分散式記憶體快取伺服器，一般目的是為了通過快取資料庫的查詢命中減少資料庫壓力、提高應用響應速度、提高可擴充套件性。

memcached快取應用

memcached快取特點

協議簡單
基於libevent的事件處理
內建記憶體儲存方式
memcached不相互通訊的分散式

memcached分散式原理

今天的內容主要涉及memcached特點的第四條，memcached不相互通訊，那麼memcached是如何實現分散式的呢？memcached的分散式實現主要依賴客戶端的實現：

memcached分散式

如上圖所示，我們看下快取的儲存的一般流程：

當資料到達客戶端，客戶端實現的演算法就會根據“鍵”來決定儲存的memcached伺服器，伺服器選定後，命令他儲存資料。取的時候也一樣，客戶端根據“鍵”選擇伺服器，使用儲存時候的相同演算法就能保證選中和存的時候相同的伺服器。

餘數計算分散法

餘數計算分散法是memcached標準的memcached分散式方法，演算法如下：

CRC($key)%N

1	CRC($key)%N

該演算法下，客戶端首先根據key來計算CRC，然後結果對伺服器數進行取模得到memcached伺服器節點，對於這種方式有兩個問題值得說明一下：

當選擇到的伺服器無法連線的時候，一種解決辦法是將嘗試的連線次數加到key後面，然後重新進行hash，這種做法也叫rehash。
第二個問題也是這種方法的致命的缺點，儘管餘數計算分散發相當簡單，資料分散也很優秀，當新增或者移除伺服器的時候，快取重組的代價相當大。

Consistent Hashing演算法

Consistent Hashing演算法描述如下：首先求出memcached伺服器節點的雜湊值，並將其分配到0~2^32的圓上，這個圓我們可以把它叫做值域，然後用同樣的方法求出儲存資料鍵的雜湊值，並對映到圓上。然後從資料對映到的位置開始順時針查詢，將資料儲存到找到的第一個伺服器上，如果超過0~2^32仍找不到，就會儲存在第一臺memcached伺服器上：

memcachd基本原理

再丟擲上面的問題，如果新新增或移除一臺機器，在consistent Hashing演算法下會有什麼影響。上圖中假設有四個節點，我們再新增一個節點叫node5:

新增了node節點之後

node5被放在了node4與node2之間，本來對映到node2和node4之間的區域都會找到node4，當有node5的時候，node5和node4之間的還是找到node4，而node5和node2之間的此時會找到node5，因此當新增一臺伺服器的時候受影響的僅僅是node5和node2區間。

優化的Consistent Hashing演算法

上面可以看出使用consistent Hashing最大限度的抑制了鍵的重新分配，且有的consistent Hashing的實現方式還採用了虛擬節點的思想。問題起源於使用一般hash函式的話，伺服器的對映地點的分佈非常不均勻，從而導致資料庫訪問傾斜，大量的key被對映到同一臺伺服器上。為了避免這個問題，引入了虛擬節點的機制，為每臺伺服器計算出多個hash值，每個值對應環上的一個節點位置，這種節點叫虛擬節點。而key的對映方式不變，就是多了層從虛擬節點再對映到物理機的過程。這種優化下儘管物理機很少的情況下，只要虛擬節點足夠多，也能夠使用得key分佈的相對均勻。

總結

本文介在理解快取基本概念的情況下介紹了memcached的分散式演算法實現原理，memcached的分散式是由客戶端函式庫實現的。

參考文獻：

《大型分散式網站架構設計與實踐》

《memcached全面解析》

打賞支援我寫出更多好文章，謝謝！
打賞作者

打賞支援我寫出更多好文章，謝謝！

任選一種支付方式

memcached 分散式實現原理

memcached分散式原理與實現
2019-02-28
分散式
Redis分散式實現原理
2022-04-03
Redis分散式
Redisson實現分散式鎖---原理
2019-06-18
Redis分散式
分散式鎖的實現原理
2024-11-28
分散式
分散式鎖的實現及原理
2019-05-20
分散式
分散式事務(3)---RocketMQ實現分散式事務原理
2019-07-15
分散式MQ
分散式鎖實現原理與最佳實踐
2023-11-22
分散式
Redis分散式鎖的原理和實現
2021-08-23
Redis分散式
redisson之分散式鎖實現原理（三）
2022-06-16
Redis分散式
zookeeper 分散式鎖的原理及實現
2020-12-05
分散式
Redis、Zookeeper實現分散式鎖——原理與實踐
2021-11-30
Redis分散式
Redis分散式鎖的使用與實現原理
2020-11-21
Redis分散式
詳解Redisson分散式限流的實現原理
2023-02-12
Redis分散式
資料庫分散式事務的實現原理！
2018-08-23
資料庫分散式
分散式事務之JTA原理與實現（三）
2018-08-28
分散式
聊聊Seata分散式解決方案AT模式的實現原理
2023-05-20
分散式模式
分散式鏈路追蹤框架的基本實現原理
2021-01-24
分散式框架
實戰與原理：如何基於RocketMQ實現分散式事務？
2024-01-29
MQ分散式
Memcached 原理剖析
2020-06-30
實現分散式鎖
2019-02-24
分散式
LightDB分散式實現
2022-05-29
分散式
分散式鎖實現
2021-09-07
分散式
分散式爬蟲原理之分散式爬蟲原理
2018-05-25
分散式爬蟲
MySQL資料庫分散式事務XA的實現原理分析
2019-10-18
MySql資料庫分散式
輕量級分散式鎖的設計原理分析與實現
2020-04-05
分散式
分散式事務與Seate框架（3）——Seata的AT模式實現原理
2021-06-25
分散式框架模式
分散式鎖----Redis實現
2019-07-26
分散式Redis
Redis實現分散式鎖
2019-02-16
Redis分散式
分散式鎖及其實現
2021-12-01
分散式
etcd實現分散式鎖
2022-09-04
分散式
「分散式」實現分散式鎖的正確姿勢？！
2018-09-21
分散式
溫故知新-分散式鎖的實現原理和存在的問題
2020-07-11
分散式
技術分享| 基於 Etcd 的分散式鎖實現原理及方案
2022-10-26
分散式
一文詳解｜Go 分散式鏈路追蹤實現原理
2022-06-30
Go分散式
分散式鎖之Zookeeper實現
2019-02-21
分散式
分散式鎖之Redis實現
2019-02-21
分散式Redis
利用Redis實現分散式鎖
2018-11-26
Redis分散式
redis分散式鎖-SETNX實現
2018-05-19
Redis分散式
分散式鎖實現（一）：Redis
2018-08-21
分散式Redis

memcached 分散式實現原理

摘要

快取本質

計算機體系快取

快取應用系統

memcached簡介

什麼是memcached

memcached快取特點

memcached分散式原理

餘數計算分散法

Consistent Hashing演算法

優化的Consistent Hashing演算法

總結

打賞支援我寫出更多好文章，謝謝！

相關文章