StackExchange.Redis跑起來,為什麼這麼溜?

萤火架构發表於2024-05-27

StackExchange.Redis 是一個高效能的 Redis 客戶端庫,主要用於 .NET 環境下與 Redis 伺服器進行通訊,大名鼎鼎的stackoverflow 網站就使用它。它使用非同步程式設計模型,能夠高效處理大量請求。支援 Redis 的絕大部分功能,包括髮布/訂閱、事務、Lua 指令碼等。由 StackExchange 團隊維護,質量和更新頻率有保障。這篇文章就來給大家分享下 StackExchange.Redis 為什麼玩的這麼溜。

我將透過分析 StackExchange.Redis 中的同步呼叫和非同步呼叫邏輯,來給大家一步步揭開它的神秘面紗。

同步API

向Redis傳送訊息

Redis 客戶端的 Get、Set 等操作都會封裝成為 Message,操作最終會走到這個方法,我們先大致看下程式碼:

ConnectionMultiplexer.cs

internal T? ExecuteSyncImpl<T>(Message message, ResultProcessor<T>? processor, ServerEndPoint? server, T? defaultValue = default)
{
   ...
        // 建立一個ResultBox物件,這個物件將會放到Message中用來承載Redis的返回值
        var source = SimpleResultBox<T>.Get();

        WriteResult result;

        // 鎖住ResultBox物件,下邊會有大用
        lock (source)
        {
            // 將Message傳送到Redis伺服器
            result = TryPushMessageToBridgeSync(message, processor, source, ref server);
           
            ...
            
            // 呼叫 Monitor.Wait 釋放對 ResultBox 物件的鎖,同時讓當前執行緒停在這裡
            if (Monitor.Wait(source, TimeoutMilliseconds))
            {
                Trace("Timely response to " + message);
            }
            ...
        }

        // 最終從 ResultBox 取出結果
        var val = source.GetResult(out var ex, canRecycle: true);
        ...
        return val;
    ...
}

仔細說一下大概的處理邏輯。

  1. 先構造一個ResultBox物件,用來承載Message的執行結果。
  2. 然後嘗試把這個Message推送到Redis伺服器,注意程式內部會把當前Message和ResultBox做一個繫結。
  3. 等待Redis伺服器返回,返回結果賦值到ResultBox物件上。
  4. 最後從ResultBox物件中取出結果,返回給呼叫方。

注意這裡用到了鎖(lock),還使用了Monitor.Wait,這是什麼目的呢?

Monitor.Wait 一般和 Monitor.Pulse 搭配使用,用來線上程間通訊。

  1. 呼叫 Monitor.Wait 時,lock住的ResultBox會被釋放,同時當前執行緒就會掛起,停在這裡。
  2. Redis伺服器返回結果後,把結果資料賦值到ResultBox上。
  3. 其它執行緒lock住這個ResultBox,呼叫Monitor.Pulse,之前被掛起的執行緒繼續執行。

透過這種方式,我們就達成了一個跨執行緒的同步呼叫效果。

為什麼會跨執行緒呢?直接呼叫Redis等著返回結果不行嗎?

因為 StackExchange.Redis 底層使用了 System.IO.Pipelines 來最佳化網路IO,這個庫採用了生產者/消費者的非同步模式來處理網路請求和響應,傳送資料和接收資料很可能是在不同的執行緒中。

以上就是向Redis伺服器傳送訊息的一個宏觀理解,但是這裡有一個隱藏的問題:

非同步情況下怎麼把Redis的返回結果和訊息對應上?

我們繼續跟蹤向 Redis 伺服器傳送 Message 的程式碼,也就是深入 TryPushMessageToBridgeSync 的內部。

一路跟隨,程式碼會走到這裡:

PhysicalBridge.cs

internal WriteResult WriteMessageTakingWriteLockSync(PhysicalConnection physical, Message message)
{
    ...
    bool gotLock = false;

    try
    {
        ...
        // 獲取單寫鎖,同時只能寫一個Message
        gotLock = _singleWriterMutex.Wait(0);
        if (!gotLock)
        {
            gotLock = _singleWriterMutex.Wait(TimeoutMilliseconds);
            if (!gotLock) return TimedOutBeforeWrite(message);
        }

        ...

        // 繼續呼叫內部方法寫資料
        WriteMessageInsideLock(physical, message);
        ...

        // 重新整理網路管道,將資料透過網路發出去
        physical.FlushSync(false, TimeoutMilliseconds);
    }
    catch (Exception ex) { ... }
    finally
    {
        if (gotLock)
        {
            _singleWriterMutex.Release();
        }
    }
}

這裡邊用訊號量做了一個鎖,保證同時只有一個寫操作。

那麼為什麼要保證同時只能一個寫操作呢?

我們繼續跟蹤程式碼:

private WriteResult WriteMessageToServerInsideWriteLock(PhysicalConnection connection, Message message)
{
  ...
  // 把訊息新增到佇列
  connection.EnqueueInsideWriteLock(message);

  // 把訊息寫到網路介面
  message.WriteTo(connection);
  ...
}

這裡有兩個操作,一是將Message新增到佇列,二是向網路介面寫資料。

保證同時只有一個寫操作,或者加鎖的目的,就是讓它倆一起完成,能對應起來,不會錯亂。

那麼我們還要繼續問:寫佇列和寫網路對應起來有什麼用?

這個問題不好回答,我們先來看看這兩個操作都是幹什麼用的?

為什麼要把Message寫入佇列?

同步IO可以直接拿到當前訊息的返回結果,但是 System.IO.Pipelines 底層是非同步操作,當處理結果從Redis返回時,我們需要把它對應到一個Messge上。加入佇列就是為了方便找到對應的訊息。至於為什麼用佇列,而不用集合,因為佇列能夠很好的滿足這個需求,下邊會有說明。

寫佇列程式碼在這裡:

PhysicalConnection.cs

internal void EnqueueInsideWriteLock(Message next)
{
    ...

    bool wasEmpty;
    lock (_writtenAwaitingResponse)
    {
        ...
        _writtenAwaitingResponse.Enqueue(next);
    }
    ...
}

入佇列需要先加鎖,因為可能是多執行緒環境下操作,Queue自身不是執行緒安全的。

再看一下把訊息寫到網路介面,這個的目的就是把訊息傳送到Redis伺服器,看一下程式碼:

PhysicalConnection.cs

internal static void WriteUnifiedPrefixedString(PipeWriter? maybeNullWriter, byte[]? prefix, string? value)
{
    ...
    // writer 就是管道的寫入介面
    var span = writer.GetSpan(3 + Format.MaxInt32TextLen);
    span[0] = (byte)'$';
    int bytes = WriteRaw(span, totalLength, offset: 1);
    writer.Advance(bytes);

    if (prefixLength != 0) writer.Write(prefix);
    if (encodedLength != 0) WriteRaw(writer, value, encodedLength);
    WriteCrlf(writer);
   ...
}

原始碼最底層是透過 System.IO.Pipelines 中的 PipeWriter 把 Message 命令傳送到Redis伺服器的,這段程式碼比較複雜,大家先大概知道做什麼用的就行了。

到此,向Redis傳送訊息就處理完成了。

現在我們已經大概瞭解向Redis伺服器傳送訊息的過程:在最上層透過Monitor模擬了同步操作,在最底層使用了高效的非同步IO,為了適配同步和非同步,寫操作內含了兩個子操作:寫佇列和寫網路。

但是我們仍然不能回答一個問題:寫佇列和寫網路為什麼要放到一個鎖中執行?或者說為什麼要保證同時只能一個寫操作?

要回答這個問題,我們還得繼續看程式對Redis響應結果的處理。

處理Redis響應結果

Redis 客戶端與 Redis 伺服器建立連線時,會建立一個死迴圈,持續的從 System.IO.Pipelines 的管道中讀取Redis 伺服器返回的訊息,並進行相應的處理。最上層方法就是這個 ReadFromPipe:

PhysicalConnection.cs

private async Task ReadFromPipe()
{
  ...
  while (true)
  {
      ...
      // 沒有新資料從Redis伺服器返回時,ReadAsync會等在這裡
      readResult = await input.ReadAsync().ForAwait();
      ...
    
      var buffer = readResult.Buffer;
      ...
     
      if (!buffer.IsEmpty)
      {
          // 這裡邊解析資料,並賦值到相關物件上
          handled = ProcessBuffer(ref buffer);
      }
  }
}

對返回資料的處理重點在這個 ProcessBuffer 方法中。它會先對資料進行一個簡單的解析,然後再呼叫 MatchResult,從字面義上看就是匹配結果,匹配到那個結果呢?

private int ProcessBuffer(ref ReadOnlySequence<byte> buffer)
{
  ...
  var reader = new BufferReader(buffer);
  var result = TryParseResult(_protocol >= RedisProtocol.Resp3, _arena, in buffer, ref reader, IncludeDetailInExceptions, this);
  ...
  MatchResult(result);
  ...
}

還記得我們在上邊向Redis傳送Message前,先建立了一個 ResultBox 物件,匹配的就是它。

怎麼找到對應的 ResultBox 物件呢?

看下邊的程式碼,程式從佇列中取出了一個Message 例項,就是要匹配到這個 Message 例項關聯的ResultBox。

 private void MatchResult(in RawResult result)
 {
     ...

     // 從佇列中取出最早的一條Redis操作訊息
     lock (_writtenAwaitingResponse)
     {
         if (!_writtenAwaitingResponse.TryDequeue(out msg))
         {
             throw new InvalidOperationException("Received response with no message waiting: " + result.ToString());
         }
     }
     ...

     // 將Redis返回的結果設定到取出的訊息中
     if (msg.ComputeResult(this, result))
     {
         _readStatus = msg.ResultBoxIsAsync ? ReadStatus.CompletePendingMessageAsync : ReadStatus.CompletePendingMessageSync;

         // 完成Redis操作
         msg.Complete();
     }
     ...
  }

為什麼從佇列取出的 Message 就一定能對應到 Redis 伺服器當前返回的結果呢?

要破案了,還記得上邊的那個未解問題嗎:為什麼要保證同時只能一個寫操作?

我們每次操作Redis都是:先把Message壓入佇列,然後再傳送到Redis伺服器,這兩個操作緊密的繫結在一起;而Redis伺服器是單執行緒順序處理的,最先返回的就是最早壓入佇列的。加上每次只有一個寫操作的控制,我們就能保證最先寫入佇列的(也就是最先發到Redis伺服器的)Message,就能對應到最先從Redis伺服器返回的資料。

上面這段程式中的 msg.ComputeResult 就是用來將 Redis 最新返回的資料賦值到最新從佇列中拿出來的 Message 例項中。

現在 Message 例項 已經獲取到了 Redis返回結果,還記得之前的傳送執行緒一直在掛起等待嗎?

下邊的 msg.Complete 就是來讓傳送執行緒恢復執行的,看這個程式碼 :

Message.cs(Message)

 public void Complete()
 {
     ...
     // ResultBox啟用繼續處理
     currBox?.ActivateContinuations();
 }

還有一層封裝,繼續看這個程式碼:

ResultBox.cs(SimpleResultBox)。

 void IResultBox.ActivateContinuations()
 {
     lock (this)
     { 
         // 通知等待Redis響應的執行緒,Redis返回結果了,請繼續你的表演
         Monitor.PulseAll(this);
     }
     ...
 }

Monitor.PulseAll 一出,傳送執行緒立馬恢復執行,向呼叫方返回執行結果。

一次同步呼叫就這樣完成了。

非同步API

非同步API和同步API使用相同的通訊底層,包括寫佇列和寫網路管道的處理,只是在處理返回值的方式上存在不同。大家可以看一下非同步和同步除錯堆疊的對比圖:

StackExchange.Redis跑起來,為什麼這麼溜?StackExchange.Redis跑起來,為什麼這麼溜?

執行到 PhysicalBridge.WriteMessageInsideLock 這一步時處理就同步了。這一步的程式碼上邊也貼過了,這裡再給大家看看:其中的主要邏輯就是寫佇列和寫網路管道。

private WriteResult WriteMessageToServerInsideWriteLock(PhysicalConnection connection, Message message)
{
  ...
  // 把訊息新增到佇列
  connection.EnqueueInsideWriteLock(message);

  // 把訊息寫到網路介面
  message.WriteTo(connection);
  ...
}

向Redis傳送訊息

我們再簡單看看非同步API中是如何傳送訊息的,看程式碼:

internal Task<T?> ExecuteAsyncImpl<T>(Message? message, ResultProcessor<T>? processor, object? state, ServerEndPoint? server)
{
    ...
    // 建立一個Task執行狀態跟蹤物件
    TaskCompletionSource<T?>? tcs = null;
    
    // 建立一個ResultBox物件,這個物件將會放到Message中用來承載Redis的返回值
    // 非同步這裡特別將 ResultBox 和 TaskCompletionSource 繫結到了一起
    // 獲取到Redis伺服器返回的資料後,TaskCompletionSource 的執行狀態將被更新為完成
    IResultBox<T?>? source = null;
    if (!message.IsFireAndForget)
    {
        source = TaskResultBox<T?>.Create(out tcs, state);
    }

    // 將Message訊息傳送到 Redis伺服器
    var write = TryPushMessageToBridgeAsync(message, processor, source!, ref server);
   
    ...

    // 返回Task,呼叫方可以 await
    return tcs.Task;
}

相比同步API,這裡多建立了一個 TaskCompletionSource 的例項,它用來跟蹤非同步任務的執行狀態,程式會在接收到Redis伺服器的返回資料時,將 TaskCompletionSource 的狀態更新為完成執行。

裡邊的程式碼我就不展開講了,大家有興趣的可以按照上方我截圖的呼叫堆疊去跟蹤下。

處理Redis響應結果

非同步API和同步API使用同一個死迴圈方法:ReadFromPipe,程式啟動時也只有這一個死迴圈在執行。

程式碼上邊都講過了,這裡只說下最後“ResultBox啟用繼續處理”的部分,這個 ResultBox 和同步呼叫的 ResultBox 略有不同,看程式碼:

void IResultBox.ActivateContinuations()
{
   ...
   ActivateContinuationsImpl();
}

private void ActivateContinuationsImpl()
{
    var val = _value;
    ...
    TrySetResult(val);
    ...
}
public bool TrySetResult(TResult result)
{
    // 設定非同步任務執行完成
    bool rval = _task.TrySetResult(result);
    ...
    return rval;
}

最重要的就是 _task.TrySetResult 這句,這裡的 _task 就是發起非同步呼叫時建立的 TaskCompletionSource 例項,TrySetResult 的作用就是設定非同步任務執行完成,對應的 await 程式碼就可以繼續向下執行了。

await client.SetAsync("hello", "fireflysoft.net");

// 繼續執行下邊的程式碼
...

總結

總體執行邏輯

透過對同步API、非同步API的執行邏輯分析,我這裡總結了一張圖,可以讓大家快速的理清其中的處理邏輯。

StackExchange.Redis跑起來,為什麼這麼溜?

我再用文字描述下這個執行邏輯:

1、無論是同步呼叫還是非同步呼叫,StackExchange.Redis 底層都是先會建立一個 Message 物件;每個 Message 物件都會關聯一個ResultBox物件(同步和非同步呼叫對應的ResultBox物件略有不同),這個物件用來承載Redis執行結果;

2、然後程式會把Message存入佇列、傳送到網路IO管道,寫佇列和寫網路IO放到了一個互斥鎖中,同時只有一個Message寫入,這是為了保證收到Redis響應時正好對應佇列中的第一條資料。

執行完這些操作後,API會等待,但是同步呼叫和非同步呼叫等待的方式不同,同步會掛起執行緒等待其它執行緒同步結果,非同步會使用await等待Task執行結果;

3、Redis 命令被髮送到網路,抵達Redis伺服器

4、接收到Redis伺服器的響應資料,這些資料會放到網路IO管道中。

5、有一個執行緒持續監聽IO管道中收到的資料,一旦拿到資料,就去佇列中取出一個Message,把伺服器返回的資料寫到這個Message的ResultBox中。

給ResultBox賦值完,程式還會通知等待的API繼續執行,同步呼叫是透過執行緒通訊的方式通知,非同步呼叫是透過更新Task的執行結果狀態來通知。

最後API從ResultBox中取出資料返回給呼叫方。

管道技術

無論是同步呼叫還是非同步呼叫,它們的底層通訊方式都統一到了管道技術,這是 StackExchange.Redis 效能出類拔萃的根基,這部分就專門來介紹下。

這裡說的管道技術指的是使用System.IO.Pipelines庫,這個庫提供了一種高效的方式來最佳化流式資料處理,具備更高的吞吐量、更低的延遲。具體用途:網路上,可以用來構建高效能的TCP或UDP伺服器;對於大檔案的讀寫操作,使用Pipelines可以減少記憶體佔用,提高處理速度。

PipeWriter和PipeReader是System.IO.Pipelines中的核心元件,它們用於構建管道處理資料流。這裡分享個例子:

using System;
using System.IO.Pipelines;
using System.Text;
using System.Threading.Tasks;

class Program
{
    static async Task Main(string[] args)
    {
        // 建立一個管道
        var pipe = new Pipe();

        // 啟動一個任務來寫入資料
        var writing = FillPipeAsync(pipe.Writer);

        // 啟動一個任務來讀取資料
        var reading = ReadPipeAsync(pipe.Reader);

        await Task.WhenAll(reading, writing);
    }

    private static async Task FillPipeAsync(PipeWriter writer)
    {
        for (int i = 0; i < 5; i++)
        {
            // 寫入一些資料到管道中
            string message = $"Message {i}";
            byte[] messageBytes = Encoding.UTF8.GetBytes(message);

            // 將資料寫入管道
            Memory<byte> memory = writer.GetMemory(messageBytes.Length);
            messageBytes.CopyTo(memory);
            writer.Advance(messageBytes.Length);

            // 通知管道有資料寫入
            FlushResult result = await writer.FlushAsync();

            if (result.IsCompleted)
            {
                break;
            }

            // 模擬一些延遲
            await Task.Delay(500);
        }

        // 告訴管道我們已經完成寫入
        await writer.CompleteAsync();
    }

    private static async Task ReadPipeAsync(PipeReader reader)
    {
        while (true)
        {
            // 讀取管道中的資料
            ReadResult result = await reader.ReadAsync();
            var buffer = result.Buffer;

            // 處理讀取到的資料
            foreach (var segment in buffer)
            {
                string message = Encoding.UTF8.GetString(segment.Span);
                Console.WriteLine($"Read: {message}");
            }

            // 告訴管道我們已經處理了這些資料
            reader.AdvanceTo(buffer.End);

            // 如果沒有更多資料可以讀取,退出迴圈
            if (result.IsCompleted)
            {
                break;
            }
        }

        // 告訴管道我們已經完成讀取
        await reader.CompleteAsync();
    }
}

在這個示例中,我們建立了一個 Pipe 物件,並分別啟動了兩個任務來寫入和讀取資料:

  1. FillPipeAsync 方法中,使用 PipeWriter 寫入資料到管道。
  2. ReadPipeAsync 方法中,使用 PipeReader 從管道中讀取資料並處理。

透過這種方式,我們可以高效地處理流式資料,同時利用管道的優勢來提高吞吐量和降低延遲。

其實在很多的高效能IO庫中,使用的都是管道技術,比如Java的NIO、Windows的IOCP、Linux的epoll,本質上都是透過一個類似管道的東西來統籌管理資料傳輸,減少不必要的呼叫和檢查,達到高效通訊的目的。


以上就是本文的主要內容,如有問題,歡迎討論交流!

相關文章