安裝和使用memcached(linux)

cyzero發表於2013-02-27

如何將 memcached 融入到您的環境中?

在開始安裝和使用 using memcached 之前,我們需要了解如何將 memcached 融入到您的環境中。雖然在任何地方都可以使用 memcached,但我發現需要在資料庫層中執行幾個經常性查詢時,memcached 往往能發揮最大的效用。我經常會在資料庫和應用伺服器之間設定一系列 memcached 例項,並採用一種簡單的模式來讀取和寫入這些伺服器。圖 1 可以幫助您瞭解如何設定應用程式體系結構:


圖 1. 使用 memcached 的示例應用程式體系結構
使用 memcached 的示例應用程式體系結構

體系結構相當容易理解。我建立了一個 Web 層,其中包括一些 Apache 例項。下一層是應用程式本身。這一層通常執行於 Apache Tomcat 或其他開源應用伺服器之上。再下面一層是配置 memcached 例項的地方 — 即應用伺服器與資料庫伺服器之間。在使用這種配置時,需要採用稍微不同的方式來執行資料庫的讀取和寫入操作。

讀取

我執行讀取操作的順序是從 Web 層獲取請求(需要執行一次資料庫查詢)並檢查之前在快取中儲存的查詢結果。如果我找到所需的值,則返回它。如果未找到,則執行查詢並將結果儲存在快取中,然後再將結果返回給 Web 層。

寫入

將資料寫入到資料庫中時,首先需要執行資料庫寫入操作,然後將之前快取的任何受此寫入操作影響的結果設定為無效。此過程有助於防止快取和資料庫之間出現資料不一致性。

安裝 memcached

memcached 支援一些作業系統,包括 Linux®、Windows®、Mac OS 和 Solaris。在本文中,我將詳細介紹如何通過原始檔構建和安裝 memcached。採用這種方式的主要原因是我在遇到問題時可以檢視原始碼。

libevent

libevent 是安裝 memcached 的唯一前提條件。它是 memcached 所依賴的非同步事件通知庫。您可以在monkey.org 上找到關於 libevent 的原始檔。接下來,找到其最新版本的原始檔。對於本文,我們使用穩定的 1.4.11 版本。獲取了歸檔檔案之後,將它解壓到一個方便的位置,然後執行清單 1 中的命令:


清單 1. 生成和安裝 libevent
				
cd libevent-1.4.11-stable/

./configure
			
make
				
make install

memcached

Danga Interactive 獲取 memcached 原始檔,仍然選擇最新的分發版。在撰寫本文時,其最新版本是 1.4.0。將 tar.gz 解壓到方便的位置,並執行清單 2 中的命令:


清單 2. 生成和安裝 memcached
				
cd memcached-1.4.0/

./configure
			
make
				
make install

完成這些步驟之後,您應該安裝了一個 memcached 工作副本,並且可以使用它了。讓我們進行簡單介紹,然後使用它。

使用 memcached

要開始使用 memcached,您首先需要啟動 memcached 伺服器,然後使用 telnet 客戶機連線到它。

要啟動 memcached,執行清單 3 中的命令:


清單 3. 啟動 memcached
				
./memcached -d -m 2048 -l 10.0.0.40 -p 11211

這會以守護程式的形式啟動 memcached(-d),為其分配 2GB 記憶體(-m 2048),並指定監聽 localhost,即埠 11211。您可以根據需要修改這些值,但以上設定足以完成本文中的練習。接下來,您需要連線到 memcached。您將使用一個簡單的 telnet 客戶機連線到 memcached 伺服器。

大多數作業系統都提供了內建的 telnet 客戶機,但如果您使用的是基於 Windows 的作業系統,則需要下載第三方客戶機。我推薦使用 PuTTy

安裝了 telnet 客戶機之後,執行清單 4 中的命令:


清單 4. 連線到 memcached
				
telnet localhost 11211

如果一切正常,則應該得到一個 telnet 響應,它會指示 Connected to localhost(已經連線到 localhost)。如果未獲得此響應,則應該返回之前的步驟並確保 libevent 和 memcached 的原始檔都已成功生成。

您現現已經登入到 memcached 伺服器。此後,您將能夠通過一系列簡單的命令來與 memcached 通訊。9 個 memcached 客戶端命令可以分為三類:

  • 基本
  • 高階
  • 管理

基本 memcached 客戶機命令

您將使用五種基本 memcached 命令執行最簡單的操作。這些命令和操作包括:

  • set
  • add
  • replace
  • get
  • delete

 

前三個命令是用於操作儲存在 memcached 中的鍵值對的標準修改命令。它們都非常簡單易用,且都使用清單 5 所示的語法:


清單 5. 修改命令語法
				
command <key> <flags> <expiration time> <bytes>
<value>

表 1 定義了 memcached 修改命令的引數和用法。


表 1. memcached 修改命令引數
引數 用法
key key 用於查詢快取值
flags 可以包括鍵值對的整型引數,客戶機使用它儲存關於鍵值對的額外資訊
expiration time 在快取中儲存鍵值對的時間長度(以秒為單位,0 表示永遠)
bytes 在快取中儲存的位元組點
value 儲存的值(始終位於第二行)

現在,我們來看看這些命令的實際使用。

set
set 命令用於向快取新增新的鍵值對。如果鍵已經存在,則之前的值將被替換。

注意以下互動,它使用了 set 命令:

set userId 0 0 5
12345
STORED

如果使用 set 命令正確設定了鍵值對,伺服器將使用單詞 STORED 進行響應。本示例向快取中新增了一個鍵值對,其鍵為userId,其值為 12345。並將過期時間設定為 0,這將向 memcached 通知您希望將此值儲存在快取中直到刪除它為止。

add
僅當快取中不存在鍵時,add 命令才會向快取中新增一個鍵值對。如果快取中已經存在鍵,則之前的值將仍然保持相同,並且您將獲得響應 NOT_STORED

下面是使用 add 命令的標準互動:

set userId 0 0 5
12345
STORED

add userId 0 0 5
55555
NOT_STORED

add companyId 0 0 3
564
STORED

replace
僅當鍵已經存在時,replace 命令才會替換快取中的鍵。如果快取中不存在鍵,那麼您將從 memcached 伺服器接受到一條 NOT_STORED 響應。

下面是使用 replace 命令的標準互動:

replace accountId 0 0 5
67890
NOT_STORED

set accountId 0 0 5
67890
STORED

replace accountId 0 0 5
55555
STORED

最後兩個基本命令是 getdelete。這些命令相當容易理解,並且使用了類似的語法,如下所示:

command <key>

接下來看這些命令的應用。

get
get 命令用於檢索與之前新增的鍵值對相關的值。您將使用 get 執行大多數檢索操作。

下面是使用 get 命令的典型互動:

set userId 0 0 5
12345
STORED

get userId
VALUE userId 0 5
12345
END

get bob
END

如您所見,get 命令相當簡單。您使用一個鍵來呼叫 get,如果這個鍵存在於快取中,則返回相應的值。如果不存在,則不返回任何內容。

delete
最後一個基本命令是 deletedelete 命令用於刪除 memcached 中的任何現有值。您將使用一個鍵呼叫delete,如果該鍵存在於快取中,則刪除該值。如果不存在,則返回一條 NOT_FOUND 訊息。

下面是使用 delete 命令的客戶機伺服器互動:

set userId 0 0 5
98765
STORED

delete bob
NOT_FOUND

delete userId
DELETED

get userId
END

高階 memcached 客戶機命令

可以在 memcached 中使用的兩個高階命令是 getscasgetscas 命令需要結合使用。您將使用這兩個命令來確保不會將現有的名稱/值對設定為新值(如果該值已經更新過)。我們來分別看看這些命令。

gets
gets 命令的功能類似於基本的 get 命令。兩個命令之間的差異在於,gets 返回的資訊稍微多一些:64 位的整型值非常像名稱/值對的 “版本” 識別符號。

下面是使用 gets 命令的客戶機伺服器互動:

set userId 0 0 5
12345
STORED

get userId
VALUE userId 0 5
12345
END

gets userId
VALUE userId 0 5 4
12345
END

考慮 getgets 命令之間的差異。gets 命令將返回一個額外的值 — 在本例中是整型值 4,用於標識名稱/值對。如果對此名稱/值對執行另一個set 命令,則 gets 返回的額外值將會發生更改,以表明名稱/值對已經被更新。清單 6 顯示了一個例子:


清單 6. set 更新版本指示符
				
set userId 0 0 5
33333
STORED

gets userId
VALUE userId 0 5 5
33333
END

您看到 gets 返回的值了嗎?它已經更新為 5。您每次修改名稱/值對時,該值都會發生更改。

cas
cas(check 和 set)是一個非常便捷的 memcached 命令,用於設定名稱/值對的值(如果該名稱/值對在您上次執行 gets 後沒有更新過)。它使用與 set 命令相類似的語法,但包括一個額外的值:gets 返回的額外值。

注意以下使用 cas 命令的互動:

set userId 0 0 5
55555
STORED

gets userId
VALUE userId 0 5 6
55555
END

cas userId 0 0 5 6
33333
STORED

如您所見,我使用額外的整型值 6 來呼叫 gets 命令,並且操作執行非常順序。現在,我們來看看清單 7 中的一系列命令:


清單 7. 使用舊版本指示符的 cas 命令
				
set userId 0 0 5
55555
STORED

gets userId
VALUE userId 0 5 8
55555
END

cas userId 0 0 5 6
33333
EXISTS

注意,我並未使用 gets 最近返回的整型值,並且 cas 命令返回 EXISTS 值以示失敗。從本質上說,同時使用getscas 命令可以防止您使用自上次讀取後經過更新的名稱/值對。

快取管理命令

最後兩個 memcached 命令用於監控和清理 memcached 例項。它們是 statsflush_all 命令。

stats
stats 命令的功能正如其名:轉儲所連線的 memcached 例項的當前統計資料。在下例中,執行 stats 命令顯示了關於當前 memcached 例項的資訊:

stats
STAT pid 63
STAT uptime 101758
STAT time 1248643186
STAT version 1.4.11
STAT pointer_size 32
STAT rusage_user 1.177192
STAT rusage_system 2.365370
STAT curr_items 2
STAT total_items 8
STAT bytes 119
STAT curr_connections 6
STAT total_connections 7
STAT connection_structures 7
STAT cmd_get 12
STAT cmd_set 12
STAT get_hits 12
STAT get_misses 0
STAT evictions 0
STAT bytes_read 471
STAT bytes_written 535
STAT limit_maxbytes 67108864
STAT threads 4
END

此處的大多數輸出都非常容易理解。稍後在討論快取效能時,我還將詳細解釋這些值的含義。至於目前,我們先來看看輸出,然後再使用新的鍵來執行一些 set 命令,並再次執行stats 命令,注意發生了哪些變化。

flush_all
flush_all 是最後一個要介紹的命令。這個最簡單的命令僅用於清理快取中的所有名稱/值對。如果您需要將快取重置到乾淨的狀態,則 flush_all 能提供很大的用處。下面是一個使用 flush_all 的例子:

set userId 0 0 5
55555
STORED

get userId
VALUE userId 0 5
55555
END

flush_all
OK

get userId
END

快取效能

在本文的最後,我將討論如何使用高階 memcached 命令來確定快取的效能。stats 命令用於調優快取的使用。需要注意的兩個最重要的統計資料是 et_hits 和 get_misses。這兩個值分別指示找到名稱/值對的次數(get_hits)和未找到名稱/值對的次數(get_misses)。

結合這些值,我們可以確定快取的利用率如何。初次啟動快取時,可以看到 get_misses 會自然地增加,但在經過一定的使用量之後,這些 get_misses 值應該會逐漸趨於平穩 — 這表示快取主要用於常見的讀取操作。如果您看到 get_misses 繼續快速增加,而 get_hits 逐漸趨於平穩,則需要確定一下所快取的內容是什麼。您可能快取了錯誤的內容。

確定快取效率的另一種方法是檢視快取的命中率(hit ratio)。快取命中率表示執行 get 的次數與錯過 get 的次數的百分比。要確定這個百分比,需要再次執行stats 命令,如清單 8 所示:


清單 8. 計算快取命中率
				
stats
STAT pid 6825
STAT uptime 540692
STAT time 1249252262
STAT version 1.2.6
STAT pointer_size 32
STAT rusage_user 0.056003
STAT rusage_system 0.180011
STAT curr_items 595
STAT total_items 961
STAT bytes 4587415
STAT curr_connections 3
STAT total_connections 22
STAT connection_structures 4
STAT cmd_get 2688
STAT cmd_set 961
STAT get_hits 1908
STAT get_misses 780
STAT evictions 0
STAT bytes_read 5770762
STAT bytes_written 7421373
STAT limit_maxbytes 536870912
STAT threads 1
END

現在,用 get_hits 的數值除以 cmd_gets。在本例中,您的命中率大約是 71%。在理想情況下,您可能希望得到更高的百分比 — 比率越高越好。檢視統計資料並不時測量它們可以很好地判定快取策略的效率。

 

常有命令如下:

 

啟動/結束
memcached -d -m 10 -u root -l 192.168.0.122 -p 11200 -c 256 -P /tmp/memcached.pid
-d 選項是啟動一個守護程式,
-m 是分配給Memcache使用的記憶體數量,單位是MB,這裡是10MB
-u 是執行Memcache的使用者,這裡是root
-l 是監聽的伺服器IP地址,如果有多個地址的話,這裡指定了伺服器的IP地址192.168.0.122
-p 是設定Memcache監聽的埠,這裡設定了12000,最好是1024以上的埠
-c 選項是最大執行的併發連線數,預設是1024,這裡設定了256,按照你伺服器的負載量來設定
-P 是設定儲存Memcache的pid檔案
kill `cat /tmp/memcached.pid`

獲取執行狀態
echo stats | nc 192.168.1.123 11200
watch "echo stats | nc 192.168.1.123 11200" (實時狀態)

相關文章