深入理解Redis主鍵失效原理及實現機制

發表於2014-06-12

對於快取失效,不同的快取有不同的處理機制,可以說是大同中有小異,作者通過對Redis 文件與相關原始碼的仔細研讀,為大家詳細剖析了 Redis 的快取過期/失效機制相關的技術原理與實現細節。

下面是作者原文:

作為一種定期清理無效資料的重要機制,主鍵失效存在於大多數快取系統中,Redis 也不例外。在 Redis 提供的諸多命令中,EXPIRE、EXPIREAT、PEXPIRE、PEXPIREAT 以及 SETEX 和 PSETEX 均可以用來設定一條 Key-Value 對的失效時間,而一條 Key-Value 對一旦被關聯了失效時間就會在到期後自動刪除(或者說變得無法訪問更為準確)。可以說,主鍵失效這個概念還是比較容易理解的,但是在具體實現到 Redis 中又是如何呢?最近本博主就對 Redis 中的主鍵失效機制產生了幾個疑問,並根據這些疑問對其進行了仔細的探究,現總結所得如下,以饗各位看客。

一、失效時間的控制

除了呼叫PERSIST命令外,還有沒有其他情況會撤銷一個主鍵的失效時間?答案是肯定的。首先,在通過 DEL 命令刪除一個主鍵時,失效時間自然會被撤銷(這不是廢話麼,哈哈)。其次,在一個設定了失效時間的主鍵被更新覆蓋時,該主鍵的失效時間也會被撤銷(這貌似也是廢話,哈哈)。但需要注意的是,這裡所說的是主鍵被更新覆蓋,而不是主鍵對應的 Value 被更新覆蓋,因此 SET、MSET 或者是 GETSET 可能會導致主鍵被更新覆蓋,而像 INCR、DECR、LPUSH、HSET 等都是更新主鍵對應的值,這類操作是不會觸碰主鍵的失效時間的。此外,還有一個特殊的命令就是 RENAME,當我們使用 RENAME 對一個主鍵進行重新命名後,之前關聯的失效時間會自動傳遞給新的主鍵,但是如果一個主鍵是被RENAME所覆蓋的話(如主鍵 hello 可能會被命令 RENAME world hello 所覆蓋),這時被覆蓋主鍵的失效時間會被自動撤銷,而新的主鍵則繼續保持原來主鍵的特性。

二、失效的內部實現

Redis 中的主鍵失效是如何實現的,即失效的主鍵是如何刪除的?實際上,Redis 刪除失效主鍵的方法主要有兩種:

  • 消極方法(passive way),在主鍵被訪問時如果發現它已經失效,那麼就刪除它
  • 積極方法(active way),週期性地從設定了失效時間的主鍵中選擇一部分失效的主鍵刪除

失效的內部表示

接下來我們就通過程式碼來探究一下這兩種方法的具體實現,但在此之前,我們先看一看Redis是如何管理和維護主鍵的吧(注:本博文中的原始碼全部來自 Redis-2.6.12)。

【程式碼段一】給出了 Redis 中關於資料庫的結構體定義,這個結構體定義中除了 id 以外都是指向字典的指標,其中我們只看 dict 和 expries,前者用來維護一個 Redis 資料庫中包含的所有 Key-Value 對(其結構可以理解為 dict[key]:value,即主鍵與值之間的對映),後者則用於維護一個 Redis 資料庫中設定了失效時間的主鍵(其結構可以理解為 expires[key]:timeout,即主鍵與失效時間的對映)。當我們使用 SETEX 和 PSETEX 命令向系統插入資料時,Redis 首先將 Key 和 Value 新增到 dict 這個字典表中,然後將 Key 和失效時間新增到 expires 這個字典表中。當我們使用 EXPIRE、EXPIREAT、PEXPIRE 和 PEXPIREAT 命令設定一個主鍵的失效時間時,Redis 首先到 dict 這個字典表中查詢要設定的主鍵是否存在,如果存在就將這個主鍵和失效時間新增到 expires 這個字典表。簡單地總結來說就是,設定了失效時間的主鍵和具體的失效時間全部都維護在 expires 這個字典表中。

【程式碼段一】

消極方法

在大致瞭解了 Redis 是如何維護設定了失效時間的主鍵之後,我們就先來看一看 Redis 是如何實現消極地刪除失效主鍵的。【程式碼段二】給出了一個名為 expireIfNeeded 的函式,這個函式在任何訪問資料的函式中都會被呼叫,也就是說 Redis 在實現 GET、MGET、HGET、LRANGE 等所有涉及到讀取資料的命令時都會呼叫它,它存在的意義就是在讀取資料之前先檢查一下它有沒有失效,如果失效了就刪除它。【程式碼段二】中給出了 expireIfNeeded 函式的所有相關描述,這裡就不再重複它的實現方法了。這裡需要說明的是在 expireIfNeeded 函式中呼叫的另外一個函式 propagateExpire,這個函式用來在正式刪除失效主鍵之前廣播這個主鍵已經失效的資訊,這個資訊會傳播到兩個目的地:一個是傳送到 AOF檔案,將刪除失效主鍵的這一操作以 DEL Key 的標準命令格式記錄下來;另一個就是傳送到當前 Redis 伺服器的所有 Slave,同樣將刪除失效主鍵的這一操作以 DEL Key 的標準命令格式告知這些 Slave 刪除各自的失效主鍵。從中我們可以知道,所有作為 Slave 來執行的 Redis 伺服器並不需要通過消極方法來刪除失效主鍵,它們只需要對 Master 唯命是從就 OK 了!

【程式碼段二】

【程式碼段三】

積極方法

以上我們通過對 expireIfNeeded 函式的介紹瞭解了 Redis 是如何以一種消極的方式刪除失效主鍵的,但是僅僅通過這種方式顯然是不夠的,因為如果某些失效的主鍵遲遲等不到再次訪問的話,Redis 就永遠不會知道這些主鍵已經失效,也就永遠也不會刪除它們了,這無疑會導致記憶體空間的浪費。因此,Redis 還準備了一招積極的刪除方法,該方法利用 Redis 的時間事件來實現,即每隔一段時間就中斷一下完成一些指定操作,其中就包括檢查並刪除失效主鍵。這裡我們說的時間事件的回撥函式就是 serverCron,它在 Redis 伺服器啟動時建立,每秒的執行次數由巨集定義 REDIS_DEFAULT_HZ 來指定,預設每秒鐘執行10次。【程式碼段四】給出該時間事件建立時的程式程式碼,該程式碼在 redis.c檔案的 initServer 函式中。實際上,serverCron 這個回撥函式不僅要進行失效主鍵的檢查與刪除,還要進行統計資訊的更新、客戶端連線超時的控制、BGSAVE 和 AOF 的觸發等等,這裡我們僅關注刪除失效主鍵的實現,也就是函式 activeExpireCycle。

【程式碼段四】

【程式碼段五】給出了函式 activeExpireCycle 的實現及其詳細描述,其主要實現原理就是遍歷處理 Redis 伺服器中每個資料庫的 expires 字典表中,從中嘗試著隨機抽樣 REDIS_EXPIRELOOKUPS_PER_CRON(預設值為10)個設定了失效時間的主鍵,檢查它們是否已經失效並刪除掉失效的主鍵,如果失效的主鍵個數佔本次抽樣個數的比例超過25%,Redis 會認為當前資料庫中的失效主鍵依然很多,所以它會繼續進行下一輪的隨機抽樣和刪除,直到剛才的比例低於25%才停止對當前資料庫的處理,轉向下一個資料庫。這裡我們需要注意的是,activeExpireCycle 函式不會試圖一次性處理Redis中的所有資料庫,而是最多隻處理 REDIS_DBCRON_DBS_PER_CALL(預設值為16),此外 activeExpireCycle 函式還有處理時間上的限制,不是想執行多久就執行多久,凡此種種都只有一個目的,那就是避免失效主鍵刪除佔用過多的CPU資源。【程式碼段五】有對 activeExpireCycle 所有程式碼的詳細描述,從中可以瞭解該函式的具體實現方法。

【程式碼段五】

三、Memcached 刪除失效主鍵的方法與 Redis 有何異同?

首先,Memcached 在刪除失效主鍵時也是採用的消極方法,即 Memcached 內部也不會監視主鍵是否失效,而是在通過 Get 訪問主鍵時才會檢查其是否已經失效。其次,Memcached 與 Redis 在主鍵失效機制上的最大不同是,Memcached 不會像 Redis 那樣真正地去刪除失效的主鍵,而只是簡單地將失效主鍵佔用的空間回收。這樣當有新的資料寫入到系統中時,Memcached 會優先使用那些失效主鍵的空間。如果失效主鍵的空間用光了,Memcached 還可以通過 LRU 機制來回收那些長期得不到訪問的空間,因此 Memcached 並不需要像 Redis 中那樣的週期性刪除操作,這也是由 Memcached 使用的記憶體管理機制決定的。同時,這裡需要指出的是 Redis 在出現 OOM 時同樣可以通過配置 maxmemory-policy 這個引數來決定是否採用 LRU 機制來回收記憶體空間(感謝@Jonathan_Dai 同學在《Redis的LRU機制》中對原文的指正)。

四、Redis 的主鍵失效機制會不會影響系統效能?

通過以上對 Redis 主鍵失效機制的介紹,我們知道雖然 Redis 會定期地檢查設定了失效時間的主鍵並刪除已經失效的主鍵,但是通過對每次處理資料庫個數的限制、activeExpireCycle 函式在一秒鐘內執行次數的限制、分配給 activeExpireCycle 函式CPU時間的限制、繼續刪除主鍵的失效主鍵數百分比的限制,Redis 已經大大降低了主鍵失效機制對系統整體效能的影響,但是如果在實際應用中出現大量主鍵在短時間內同時失效的情況還是會使得系統的響應能力降低,所以這種情況無疑應該避免。

參考文獻連結:

相關文章