Redis 命令的執行過程

犀利豆發表於2018-03-30

原文網址 : https://juejin.im/post/5abe66166fb9a028b77aed7b

原文地址：www.xilidou.com/2018/03/30/…

之前寫了一系列文章，已經很深入的探討了 Redis 的資料結構，資料庫的實現，key的過期策略以及 Redis 是怎麼處理事件的。所以距離 Redis 的單機實現只差最後一步了，就是 Redis 是怎麼處理 client 發來的命令並返回結果的，所以我們就仔細討論一下 Redis 是怎麼執行命令的。

閱讀這篇文章你將會了解到：

Redis 是怎麼執行遠端客戶端發來的命令的

Redis client（客戶端）

Redis 是單執行緒應用，它是如何與多個客戶端簡歷網路連結並處理命令的？由於 Redis 是基於 I/O 多路複用技術，為了能夠處理多個客戶端的請求，Redis 在本地為每一個連結到 Redis 伺服器的客戶端建立了一個 redisClient 的資料結構，這個資料結構包含了每個客戶端各自的狀態和執行的命令。 Redis 伺服器使用一個連結串列來維護多個 redisClient 資料結構。

在伺服器端用一個連結串列來管理所有的 redisClient。


struct redisServer {

    //...
    list *clients;              /* List of active clients */
    //...
}
複製程式碼

所以我就看看 redisClient 包含的資料結構和重要引數：

typedef struct redisClient {

    // 客戶端狀態標誌
    int flags;              /* REDIS_SLAVE | REDIS_MONITOR | REDIS_MULTI ... */
    
    // 套接字描述符
    int fd;

    // 當前正在使用的資料庫
    redisDb *db;

    // 當前正在使用的資料庫的 id （號碼）
    int dictid;

    // 客戶端的名字
    robj *name;             /* As set by CLIENT SETNAME */

    // 查詢緩衝區
    sds querybuf;

    // 查詢緩衝區長度峰值
    size_t querybuf_peak;   /* Recent (100ms or more) peak of querybuf size */

    // 引數數量
    int argc;

    // 引數物件陣列
    robj **argv;

    // 記錄被客戶端執行的命令
    struct redisCommand *cmd, *lastcmd;

    // 請求的型別：內聯命令還是多條命令
    int reqtype;

    // 剩餘未讀取的命令內容數量
    int multibulklen;       /* number of multi bulk arguments left to read */

    // 命令內容的長度
    long bulklen;           /* length of bulk argument in multi bulk request */

    // 回覆連結串列
    list *reply;

    // 回覆連結串列中物件的總大小
    unsigned long reply_bytes; /* Tot bytes of objects in reply list */

    // 已傳送位元組，處理 short write 用
    int sentlen;            /* Amount of bytes already sent in the current
                               buffer or object being sent. */

    // 回覆偏移量
    int bufpos;
    // 回覆緩衝區
    char buf[REDIS_REPLY_CHUNK_BYTES];
    // ...
}

複製程式碼

這裡需要特別的注意，redisClient 並非指遠端的客戶端，而是一個 Redis 服務本地的資料結構，我們可以理解這個 redisClient 是遠端客戶端的一個對映或者代理。

flags

flags 表示了目前客戶端的角色，以及目前所處的狀態。他比較特殊可以單獨表示一個狀態或者多個狀態。

querybuf

querybuf 是一個 sds 動態字串型別，所謂 buf 說明是它只是一個緩衝區，用於儲存沒有被解析的命令。

argc & argv

上文的 querybuf 是一個沒有處理過的命令，當 Redis 將 querybuf 命令解析以後，會將得出的引數個數和以及引數分別儲存在 argc 和 argv 中。argv 是一個 redisObject 的陣列。

cmd

Redis 使用一個字典儲存了所有的 redisCommand。key 是 redisCommand 的名字，值就是一個 redisCommand 結構，這個結構儲存了命令的實現函式，命令的標誌，命令應該給定的引數個數，命令的執行次數和總消耗時長等統計資訊，cmd 是一個 redisCommand。

當 Redis 解析出 argv 和 argc 後，會根據陣列 argv[0]，到字典中查詢出對應的 redisCommand。上文的例子中 Redis 就會去字典去查詢 SET 這個命令對應的 redisCommand。redis 會執行 redisCommand 中命令的實現函式。

buf & bufpos & reply

buf 是一個長度為 REDIS_REPLY_CHUNK_BYTES 的陣列。Redis 執行相應的操作以後，就會將需要返回的返回的資料儲存到 buf 中，bufpos 用於記錄 buf 中已用的位元組數數量，當需要恢復的資料大於 REDIS_REPLY_CHUNK_BYTES 時，redis 就會是用 reply 這個連結串列來儲存資料。

其他引數

其他引數大家看註釋就能明白，就是字面的意思。省略的引數基本上涉及 Redis 叢集管理的引數，在之後的文章中會繼續講解。

客戶端的連結和斷開

上文說過 redisServer 是用一個連結串列來維護所有的 redisClient 狀態，每當有一個客戶端發起連結以後，就會在 Redis 中生成一個對應的 redisClient 資料結構，增加到clients這個連結串列之後。

一個客戶端很可能被多種原因斷開。

總體分為幾種型別：

客戶端主動退出或者被 kill。
timeout 超時。
Redis 為了自我保護，會斷開發的資料超過限制大小的客戶端。
Redis 為了自我保護，會斷需要返回的資料超過限制大小的客戶端。

呼叫總結

當客戶端和伺服器端的巢狀字變得可讀的時候，伺服器將會呼叫命令請求處理器來執行以下操作：

讀取巢狀字中的資料，寫入 querybuf。
解析 querybuf 中的命令，記錄到 argc 和 argv 中。
根據 argv[0] 查詢對應的 recommand。
執行 recommand 對應的實現函式。
執行以後將結果存入 buf & bufpos & reply 中，返回給呼叫方。

Redis Server (服務端)

上文是從 redisClient 的角度來觀察命令的執行，文章接下來的部分將會從 Redis 的程式碼層面，微觀的觀察 Redis 是怎麼實現命令的執行的。

redisServer 的啟動

在瞭解redisServer 的工作機制的工作機制之前，需要了解 redisServer 的啟動做了什麼：

可以繼續觀察 Redis 的 main() 函式。

int main(int argc, char **argv) {

    //...

    // 建立並初始化伺服器資料結構
    initServer();

    //...
}
複製程式碼

我們只關注 initServer() 這個函式，他負責初始化伺服器的資料結構。繼續跟蹤程式碼:


void initServer() {

    //...

    //建立eventLoop
    server.el = aeCreateEventLoop(server.maxclients+REDIS_EVENTLOOP_FDSET_INCR);

    /* Create an event handler for accepting new connections in TCP and Unix
     * domain sockets. */
    // 為 TCP 連線關聯連線應答（accept）處理器
    // 用於接受並應答客戶端的 connect() 呼叫
    for (j = 0; j < server.ipfd_count; j++) {
        if (aeCreateFileEvent(server.el, server.ipfd[j], AE_READABLE,
            acceptTcpHandler,NULL) == AE_ERR)
            {
                redisPanic(
                    "Unrecoverable error creating server.ipfd file event.");
            }
    }

    // 為本地套接字關聯應答處理器
    if (server.sofd > 0 && aeCreateFileEvent(server.el,server.sofd,AE_READABLE,
        acceptUnixHandler,NULL) == AE_ERR) redisPanic("Unrecoverable error creating server.sofd file event.");

    //...

}

複製程式碼

篇幅限制，我們省略了很多與本編文章無關的程式碼，保留了核心邏輯程式碼。

在上一篇文章中《Redis 中的事件驅動模型》我們講解過，redis 使用不同的事件處理器，處理不同的事件。

在這段程式碼裡面：

初始化了事件處理器的 eventLoop
向 eventLoop 中註冊了兩個事件處理器 acceptTcpHandler 和 acceptUnixHandler，分別處理遠端的連結和本地連結。

redisClient 的建立

當有一個遠端客戶端連線到 Redis 的伺服器，會觸發 acceptTcpHandler 事件處理器.

acceptTcpHandler 事件處理器，會建立一個連結。然後繼續呼叫 acceptCommonHandler。

acceptCommonHandler 事件處理器的作用是：

呼叫 createClient() 方法建立 redisClient
檢查已經建立的 redisClient 是否超過 server 允許的數量的上限
如果超過上限就拒絕遠端連線
否則建立 redisClient 建立成功
並更新連線的統計次數，更新 redisClinet 的 flags 欄位

這個時候 Redis 在服務端建立了 redisClient 資料結構，這個時候遠端的客戶端就在 redisServer 中建立了一個代理。遠端的客戶端就與 Redis 伺服器建立了聯絡，就可以向伺服器傳送命令了。

處理命令

在 createClient() 行數中：

// 繫結讀事件到事件 loop （開始接收命令請求）
if (aeCreateFileEvent(server.el,fd,AE_READABLE,readQueryFromClient, c) == AE_ERR)
複製程式碼

向 eventLoop 中註冊了 readQueryFromClient。 readQueryFromClient 的作用就是從client中讀取客戶端的查詢緩衝區內容。

然後呼叫函式 processInputBuffer 來處理客戶端的請求。在 processInputBuffer 中有幾個核心函式：

processInlineBuffer 和 processMultibulkBuffer 解析 querybuf 中的命令，記錄到 argc 和 argv 中。
processCommand 根據 argv[0] 查詢對應的 recommen,執行 recommend 對應的執行函式。在執行之前還會驗證命令的正確性。將結果存入 buf & bufpos & reply 中

返回資料

萬事具備了，執行完了命令就需要把資料返回給遠端的呼叫方。呼叫鏈如下

processCommand -> addReply -> prepareClientToWrite

在 prepareClientToWrite 中我們有見到了熟悉的程式碼：

aeCreateFileEvent(server.el, c->fd, AE_WRITABLE,sendReplyToClient, c) == AE_ERR) return REDIS_ERR;
複製程式碼

向 eventloop 繫結了 sendReplyToClient 事件處理器。

在 sendReplyToClient 中觀察程式碼發現，如果 bufpos 大於 0，將會把 buf 傳送給遠端的客戶端，如果連結串列 reply 的長度大於0，就會將遍歷連結串列 reply，傳送給遠端的客戶端，這裡需要注意的是，為了避免 reply 資料量過大，就會過度的佔用資源引起 Redis 相應慢。為了解決這個問題，當寫入的總數量大於 REDIS_MAX_WRITE_PER_EVENT 時，Redis 將會臨時中斷寫入，記錄操作的進度，將處理時間讓給其他操作，剩餘的內容等下次繼續。這樣的套路我們一路走來看過太多了。