Memcache基礎教程

工程師WWW發表於2013-11-27

Memcache是什麼
Memcache是danga.com的一個專案,最早是為 LiveJournal 服務的,目前全世界不少人使用這個快取專案來構建自己大負載的網站,來分擔資料庫的壓力。
它可以應對任意多個連線,使用非阻塞的網路IO。由於它的工作機制是在記憶體中開闢一塊空間,然後建立一個HashTable,Memcached自管理這些HashTable。
Memcache官方網站:http://www.danga.com/memcached,更多詳細的資訊可以來這裡瞭解 :)

為什麼會有Memcache和memcached兩種名稱?
其實Memcache是這個專案的名稱,而memcached是它伺服器端的主程式檔名,知道我的意思了把~~~~。一個是專案名稱,一個是主程式檔名,在網上看到了很多人不明白,於是混用了。

Memcache的安裝
分為兩個過程:memcache伺服器端的安裝和memcached客戶端的安裝。
所謂伺服器端的安裝就是在伺服器(一般都是linux系統)上安裝Memcache實現資料的儲存
所謂客戶端的安裝就是指php(或者其他程式,Memcache還有其他不錯的api介面提供)去使用伺服器端的Memcache提供的函式,需要php新增擴充套件。

具體的配置大家可以參考:
Linux下的Memcache安裝:http://www.ccvita.com/257.html
Windows下的Memcache安裝:http://www.ccvita.com/258.html
Memcache基礎教程:http://www.ccvita.com/259.html
Discuz!的Memcache快取實現:http://www.ccvita.com/261.html
Memcache協議中文版:http://www.ccvita.com/306.html
Memcache分散式部署方案:http://www.ccvita.com/395.html

PHP的Memcache

< ?php //連線 $mem = new Memcache; $mem->connect("192.168.0.200", 12000); //儲存資料 $mem->set('key1', 'This is first value', 0, 60); $val = $mem->get('key1'); echo "Get key1 value: " . $val ."<br />"; //替換資料 $mem->replace('key1', 'This is replace value', 0, 60); $val = $mem->get('key1'); echo "Get key1 value: " . $val . "<br />"; //儲存陣列 $arr = array('aaa', 'bbb', 'ccc', 'ddd'); $mem->set('key2', $arr, 0, 60); $val2 = $mem->get('key2'); echo "Get key2 value: "; print_r($val2); echo "<br />"; //刪除資料 $mem->delete('key1'); $val = $mem->get('key1'); echo "Get key1 value: " . $val . "<br />"; //清除所有資料 $mem->flush(); $val2 = $mem->get('key2'); echo "Get key2 value: "; print_r($val2); echo "<br />"; //關閉連線 $mem->close(); ?>

如果正常的話,瀏覽器將輸出:
Get key1 value: This is first value
Get key1 value: This is replace value
Get key2 value: Array ( [0] => aaa [1] => bbb [2] => ccc [3] => ddd )
Get key1 value:
Get key2 value:

程式程式碼分析

初始化一個Memcache的物件:
$mem = new Memcache;

連線到我們的Memcache伺服器端,第一個引數是伺服器的IP地址,也可以是主機名,第二個引數是Memcache的開放的埠:
$mem->connect("192.168.0.200"12000);

儲存一個資料到Memcache伺服器上,第一個引數是資料的key,用來定位一個資料,第二個引數是需要儲存的資料內容,這裡是一個字串,第三個引數是一個標記,一般設定為0或者MEMCACHE_COMPRESSED就行了,第四個引數是資料的有效期,就是說資料在這個時間內是有效的,如果過去這個時間,那麼會被Memcache伺服器端清除掉這個資料,單位是秒,如果設定為0,則是永遠有效,我們這裡設定了60,就是一分鐘有效時間:
$mem->set('key1', 'This is first value'060);

從Memcache伺服器端獲取一條資料,它只有一個引數,就是需要獲取資料的key,我們這裡是上一步設定的key1,現在獲取這個資料後輸出輸出:
$val = $mem->get('key1');
echo "Get key1 value: " . $val;

現在是使用replace方法來替換掉上面key1的值,replace方法的引數跟set是一樣的,不過第一個引數key1是必須是要替換資料內容的key,最後輸出了:
$mem->replace('key1''This is replace value'060);
$val = $mem->get('key1');
echo "Get key1 value: " . $val;

同樣的,Memcache也是可以儲存陣列的,下面是在Memcache上面儲存了一個陣列,然後獲取回來並輸出
$arr = array('aaa', 'bbb', 'ccc''ddd');
$mem->set('key2'$arr060);
$val2 = $mem->get('key2');
print_r($val2);

現在刪除一個資料,使用delte介面,引數就是一個key,然後就能夠把Memcache伺服器這個key的資料刪除,最後輸出的時候沒有結果
$mem->delete('key1');
$val = $mem->get('key1');
echo "Get key1 value: " . $val . "<br>";

最後我們把所有的儲存在Memcache伺服器上的資料都清除,會發現資料都沒有了,最後輸出key2的資料為空,最後關閉連線
$mem->flush();
$val2 = $mem->get('key2');
echo "Get key2 value: ";
print_r($val2);
echo "<br>";

Memcache的使用
使用Memcache的網站一般流量都是比較大的,為了緩解資料庫的壓力,讓Memcache作為一個快取區域,把部分資訊儲存在記憶體中,在前端能夠迅速的進行存取。那麼一般的焦點就是集中在如何分擔資料庫壓力和進行分散式,畢竟單臺Memcache的記憶體容量的有限的。我這裡簡單提出我的個人看法,未經實踐,權當參考。

分散式應用
Memcache本來支援分散式,我們客戶端稍加改造,更好的支援。我們的key可以適當進行有規律的封裝,比如以user為主的網站來說,每個使用者都有User ID,那麼可以按照固定的ID來進行提取和存取,比如1開頭的使用者儲存在第一臺Memcache伺服器上,以2開頭的使用者的資料儲存在第二胎Mecache伺服器上,存取資料都先按照User ID來進行相應的轉換和存取。

但是這個有缺點,就是需要對User ID進行判斷,如果業務不一致,或者其他型別的應用,可能不是那麼合適,那麼可以根據自己的實際業務來進行考慮,或者去想更合適的方法。

減少資料庫壓力
這個算是比較重要的,所有的資料基本上都是儲存在資料庫當中的,每次頻繁的存取資料庫,導致資料庫效能極具下降,無法同時服務更多的使用者,比如MySQL,特別頻繁的鎖表,那麼讓Memcache來分擔資料庫的壓力吧。我們需要一種改動比較小,並且能夠不會大規模改變前端的方式來進行改變目前的架構。

我考慮的一種簡單方法:
後端的資料庫操作模組,把所有的Select操作提取出來(update/delete/insert不管),然後把對應的SQL進行相應的hash演算法計算得出一個hash資料key(比如MD5或者SHA),然後把這個key去Memcache中查詢資料,如果這個資料不存在,說明還沒寫入到快取中,那麼從資料庫把資料提取出來,一個是陣列類格式,然後把資料在set到Memcache中,key就是這個SQL的hash值,然後相應的設定一個失效時間,比如一個小時,那麼一個小時中的資料都是從快取中提取的,有效減少資料庫的壓力。缺點是資料不實時,當資料做了修改以後,無法實時到前端顯示,並且還有可能對記憶體佔用比較大,畢竟每次select出來的資料數量可能比較巨大,這個是需要考慮的因素。

Memcache的安全
我們上面的Memcache伺服器端都是直接通過客戶端連線後直接操作,沒有任何的驗證過程,這樣如果伺服器是直接暴露在網際網路上的話是比較危險,輕則資料洩露被其他無關人員檢視,重則伺服器被入侵,因為Mecache是以root許可權執行的,況且裡面可能存在一些我們未知的bug或者是緩衝區溢位的情況,這些都是我們未知的,所以危險性是可以預見的。為了安全起見,我做兩點建議,能夠稍微的防止黑客的入侵或者資料的洩露。

內網訪問
最好把兩臺伺服器之間的訪問是內網形態的,一般是Web伺服器跟Memcache伺服器之間。普遍的伺服器都是有兩塊網路卡,一塊指向網際網路,一塊指向內網,那麼就讓Web伺服器通過內網的網路卡來訪問Memcache伺服器,我們Memcache的伺服器上啟動的時候就監聽內網的IP地址和埠,內網間的訪問能夠有效阻止其他非法的訪問。
# memcached -d -m 1024 -u root -l 192.168.0.200 -p 11211 -c 1024 -P /tmp/memcached.pid
Memcache伺服器端設定監聽通過內網的192.168.0.200的ip的11211埠,佔用1024MB記憶體,並且允許最大1024個併發連線

設定防火牆
防火牆是簡單有效的方式,如果卻是兩臺伺服器都是掛在網的,並且需要通過外網IP來訪問Memcache的話,那麼可以考慮使用防火牆或者代理程式來過濾非法訪問。
一般我們在Linux下可以使用iptables或者FreeBSD下的ipfw來指定一些規則防止一些非法的訪問,比如我們可以設定只允許我們的Web伺服器來訪問我們Memcache伺服器,同時阻止其他的訪問。
# iptables -F
# iptables -P INPUT DROP
# iptables -A INPUT -p tcp -s 192.168.0.2 --dport 11211 -j ACCEPT
# iptables -A INPUT -p udp -s 192.168.0.2 --dport 11211 -j ACCEPT
上面的iptables規則就是隻允許192.168.0.2這臺Web伺服器對Memcache伺服器的訪問,能夠有效的阻止一些非法訪問,相應的也可以增加一些其他的規則來加強安全性,這個可以根據自己的需要來做。

相關文章