Redis - 物件結構

程式設計師翔仔發表於2023-03-27

簡介

Redis 使用物件儲存資料庫中的鍵和值,每當在 Redis 中建立一個新的鍵值對時,都會建立兩個物件:一個是鍵物件,另一個是值物件。

Redis 物件結構

其中,Redis 的每種物件都由物件結構和對應編碼的資料結構組合而成,而每種物件型別對應若干編碼方式,不同編碼方式對應的底層資料結構也會有所不同。

資料庫結構

Redis 伺服器的資料庫都儲存在 redisServerdb 陣列中,陣列中的每個項都是 redisDb 結構,每個 redisDb 結構代表一個資料庫。

下面是部分 redisServer 結構:

struct redisServer {
    redisDb *db;    // 儲存資料庫的陣列
    int dbnum;      // 伺服器的資料庫數量
    // ...
};

其中,初始化伺服器時,會根據 dbnum 的值決定建立多少個資料庫。預設情況下,dbnum 的值是 16。

切換資料庫

預設情況下,Redis 客戶端的目標資料庫是 0 號資料庫,但是客戶端可以使用 SELECT 命令切換目標資料庫。

需要注意的是,Redis 現在沒有向客戶端返回目標資料庫的命令,對資料庫進行誤操作極易出現不符合預期的情況,尤其是像 FLUSHDB 這樣的命令。

比較好的做法是儘量少地在程式碼中切換資料庫,即使是在命令列操作,也儘量顯式地切換到指定的資料庫,然後再執行命令。

資料庫鍵空間

每一個資料庫中都儲存了一個字典,這個字典儲存了資料庫中的所有鍵值對,這個字典又被稱為鍵空間。

所有對資料庫中鍵值對的增刪查改操作,實際上都是在操作鍵空間字典。

只是,由於資料庫可以儲存多種不同的資料結構型別,這些增刪查改操作,都會使用對應資料結構提供的函式執行。

讀寫鍵空間的維護操作

當使用 Redis 命令對鍵空間字典進行讀寫操作時,伺服器不僅會執行這些讀寫操作,還會做一些維護性的操作,提高 Redis 的可用性,其中包括:

  • 讀取一個鍵時,伺服器會根據鍵是否存在來更新鍵空間命中次數和不命中次數
  • 讀取到一個鍵之後,伺服器會更新這個鍵的 lru 屬性
  • 如果伺服器讀取到鍵之後,發現這個鍵已經過期,會先刪除這個鍵,再執行後續的操作
  • 如果有客戶端使用 WATCH 命令監視這個鍵,伺服器修改這個鍵之後,會將這個鍵標記為 dirty 狀態
  • 伺服器每次修改一個鍵之後,都會對髒計數器的值增 1,這個計數器會觸發伺服器的持久化或複製操作
  • 如果伺服器開啟了通知功能,那麼對這個鍵做修改操作之後,伺服器將按配置傳送對應的資料庫通知

型別與編碼

Redis 中的每個物件都是由一個 redisObject 結構表示,其結構如下:

typedef struct redisObject {
    unsigned type:4;        // 型別
    unsigned encoding:4;    // 編碼
    unsigned lru:LRU_BITS;  // 記錄最後訪問的時間
    int refcount;           // 引用計數
    void *ptr;              // 指向底層實現資料結構的指標
} robj;

其中 typeencodingptr 是最重要的三個屬性。

資料型別

物件的 type 屬性記錄了資料結構的型別,它總是以下列舉值之一:

  • REDIS_STRING
  • REDIS_LIST
  • REDIS_HASH
  • REDIS_SET
  • REDIS_ZSET

物件編碼

物件的 encoding 屬性記錄了 ptr 指標指向物件的編碼方式,它總是以下列舉值之一:

  • OBJ_ENCODING_RAW
  • OBJ_ENCODING_INT
  • OBJ_ENCODING_HT
  • OBJ_ENCODING_ZIPMAP
  • OBJ_ENCODING_LINKEDLIST
  • OBJ_ENCODING_ZIPLIST
  • OBJ_ENCODING_INTSET
  • OBJ_ENCODING_SKIPLIST
  • OBJ_ENCODING_EMBSTR
  • OBJ_ENCODING_QUICKLIST
  • OBJ_ENCODING_STREAM

透過使用 encoding 屬性設定物件的編碼方式,而不是使用固定編碼,這樣極大地提高了 Redis 的靈活性和效率,也方便 Redis 針對不同的場景選擇不同的編碼,針對性地做最佳化。

物件指標

物件的 ptr 屬性是一個指標,指向實際儲存值的資料結構。

空轉時間

物件的 lru 屬性記錄了物件最後一次被命令程式訪問的時間。空轉時間指的是當前時間減去 lru 屬性得到的時長,即未被訪問的時長。

鍵的空轉時間在記憶體回收演算法是 volatile-lruallkeys-lru 時使用到,當伺服器佔用的記憶體超過了 maxmemory 之後,空轉時長較高的那部分鍵會優先被伺服器釋放,從而回收記憶體。

命令執行流程

Redis 中用於操作鍵的命令分為兩類:任何型別的鍵都可以執行的命令、針對特定型別的鍵可執行的命令。例如 DELEXPIRE 等命令屬於前者,SETHSET 等命令屬於後者。

針對特定型別的鍵的執行命令,執行前需要檢查鍵的型別,確定當前鍵是否可執行當前命令。

在 Redis 中,一個資料型別有可能對應多個編碼方式,在檢查完鍵的型別之後,還需要根據資料型別的不同編碼進行多型處理。

因此,當處理一個特定型別命令的時候,執行的步驟如下:

  • 根據給定的 key 名稱,在資料庫字典中查詢相對應的 Redis 物件,如果沒有找到,返回 NULL
  • 檢查 Redis 物件中的 type 屬性和執行命令所需的型別是否相符,如果不相符,返回型別錯誤
  • 根據 Redis 物件中的 encoding 屬性選擇合適的操作函式來處理底層資料結構
  • 將操作函式的返回值作為命令請求的響應返回給客戶端

物件共享

目前,為了解決重複分配的麻煩,Redis 會在初始化伺服器時建立一萬個字串物件,這些物件包含了從 0 到 9999 的所有整數值,當伺服器需要用到值為 0 到 9999 的字串物件時,伺服器就會使用這些共享物件,而不是建立新的物件。

儘管共享更復雜的物件可以節約更多的記憶體,但受到 CPU 時間的限制,Redis 只對包含整數值的字串物件進行共享。

需要注意的是,共享物件只能被字典和雙向連結串列這類能帶有指標的資料結構使用。

記憶體回收

因為 C 語言並不具備自動記憶體回收功能,所以 Redis 在自己的物件系統中構建了一個引用計數技術實現記憶體回收機制。透過這個記憶體回收機制,Redis 可以透過物件的引用計數資訊,在適當的時候自動釋放物件並進行記憶體回收。

物件的引用計數資訊透過 refcount 屬性記錄,其使用如下:

  • 當建立新物件時,引用計數的值會初始化為 1
  • 當這個物件被共享時,引用計數的值會自增
  • 當使用完一個物件後,或者消除對這個物件的引用之後,引用計數的值會自減
  • 當物件的引用計數值變為 0 時,物件所佔用的記憶體會被釋放

相關文章