StackExchange.Redis跑起來，為什麼這麼溜？

萤火架构發表於2024-05-27

原文網址 : https://www.cnblogs.com/bossma/p/18214702

StackExchange.Redis 是一個高效能的 Redis 客戶端庫，主要用於 .NET 環境下與 Redis 伺服器進行通訊，大名鼎鼎的stackoverflow 網站就使用它。它使用非同步程式設計模型，能夠高效處理大量請求。支援 Redis 的絕大部分功能，包括髮布/訂閱、事務、Lua 指令碼等。由 StackExchange 團隊維護，質量和更新頻率有保障。這篇文章就來給大家分享下 StackExchange.Redis 為什麼玩的這麼溜。

我將透過分析 StackExchange.Redis 中的同步呼叫和非同步呼叫邏輯，來給大家一步步揭開它的神秘面紗。

同步API

向Redis傳送訊息

Redis 客戶端的 Get、Set 等操作都會封裝成為 Message，操作最終會走到這個方法，我們先大致看下程式碼：

ConnectionMultiplexer.cs

internal T? ExecuteSyncImpl<T>(Message message, ResultProcessor<T>? processor, ServerEndPoint? server, T? defaultValue = default)
{
   ...
        // 建立一個ResultBox物件，這個物件將會放到Message中用來承載Redis的返回值
        var source = SimpleResultBox<T>.Get();

        WriteResult result;

        // 鎖住ResultBox物件，下邊會有大用
        lock (source)
        {
            // 將Message傳送到Redis伺服器
            result = TryPushMessageToBridgeSync(message, processor, source, ref server);
           
            ...
            
            // 呼叫 Monitor.Wait 釋放對 ResultBox 物件的鎖，同時讓當前執行緒停在這裡
            if (Monitor.Wait(source, TimeoutMilliseconds))
            {
                Trace("Timely response to " + message);
            }
            ...
        }

        // 最終從 ResultBox 取出結果
        var val = source.GetResult(out var ex, canRecycle: true);
        ...
        return val;
    ...
}

仔細說一下大概的處理邏輯。

先構造一個ResultBox物件，用來承載Message的執行結果。
然後嘗試把這個Message推送到Redis伺服器，注意程式內部會把當前Message和ResultBox做一個繫結。
等待Redis伺服器返回，返回結果賦值到ResultBox物件上。
最後從ResultBox物件中取出結果，返回給呼叫方。

注意這裡用到了鎖（lock），還使用了Monitor.Wait，這是什麼目的呢？

Monitor.Wait 一般和 Monitor.Pulse 搭配使用，用來線上程間通訊。

呼叫 Monitor.Wait 時，lock住的ResultBox會被釋放，同時當前執行緒就會掛起，停在這裡。
Redis伺服器返回結果後，把結果資料賦值到ResultBox上。
其它執行緒lock住這個ResultBox，呼叫Monitor.Pulse，之前被掛起的執行緒繼續執行。

透過這種方式，我們就達成了一個跨執行緒的同步呼叫效果。

為什麼會跨執行緒呢？直接呼叫Redis等著返回結果不行嗎？

因為 StackExchange.Redis 底層使用了 System.IO.Pipelines 來最佳化網路IO，這個庫採用了生產者/消費者的非同步模式來處理網路請求和響應，傳送資料和接收資料很可能是在不同的執行緒中。

以上就是向Redis伺服器傳送訊息的一個宏觀理解，但是這裡有一個隱藏的問題：

非同步情況下怎麼把Redis的返回結果和訊息對應上？

我們繼續跟蹤向 Redis 伺服器傳送 Message 的程式碼，也就是深入 TryPushMessageToBridgeSync 的內部。

一路跟隨，程式碼會走到這裡：

PhysicalBridge.cs

internal WriteResult WriteMessageTakingWriteLockSync(PhysicalConnection physical, Message message)
{
    ...
    bool gotLock = false;

    try
    {
        ...
        // 獲取單寫鎖，同時只能寫一個Message
        gotLock = _singleWriterMutex.Wait(0);
        if (!gotLock)
        {
            gotLock = _singleWriterMutex.Wait(TimeoutMilliseconds);
            if (!gotLock) return TimedOutBeforeWrite(message);
        }

        ...

        // 繼續呼叫內部方法寫資料
        WriteMessageInsideLock(physical, message);
        ...

        // 重新整理網路管道，將資料透過網路發出去
        physical.FlushSync(false, TimeoutMilliseconds);
    }
    catch (Exception ex) { ... }
    finally
    {
        if (gotLock)
        {
            _singleWriterMutex.Release();
        }
    }
}

這裡邊用訊號量做了一個鎖，保證同時只有一個寫操作。

那麼為什麼要保證同時只能一個寫操作呢？

我們繼續跟蹤程式碼：

private WriteResult WriteMessageToServerInsideWriteLock(PhysicalConnection connection, Message message)
{
  ...
  // 把訊息新增到佇列
  connection.EnqueueInsideWriteLock(message);

  // 把訊息寫到網路介面
  message.WriteTo(connection);
  ...
}

這裡有兩個操作，一是將Message新增到佇列，二是向網路介面寫資料。

保證同時只有一個寫操作，或者加鎖的目的，就是讓它倆一起完成，能對應起來，不會錯亂。

那麼我們還要繼續問：寫佇列和寫網路對應起來有什麼用？

這個問題不好回答，我們先來看看這兩個操作都是幹什麼用的？

為什麼要把Message寫入佇列？

同步IO可以直接拿到當前訊息的返回結果，但是 System.IO.Pipelines 底層是非同步操作，當處理結果從Redis返回時，我們需要把它對應到一個Messge上。加入佇列就是為了方便找到對應的訊息。至於為什麼用佇列，而不用集合，因為佇列能夠很好的滿足這個需求，下邊會有說明。

寫佇列程式碼在這裡：

PhysicalConnection.cs

internal void EnqueueInsideWriteLock(Message next)
{
    ...

    bool wasEmpty;
    lock (_writtenAwaitingResponse)
    {
        ...
        _writtenAwaitingResponse.Enqueue(next);
    }
    ...
}

入佇列需要先加鎖，因為可能是多執行緒環境下操作，Queue自身不是執行緒安全的。

再看一下把訊息寫到網路介面，這個的目的就是把訊息傳送到Redis伺服器，看一下程式碼：

PhysicalConnection.cs

internal static void WriteUnifiedPrefixedString(PipeWriter? maybeNullWriter, byte[]? prefix, string? value)
{
    ...
    // writer 就是管道的寫入介面
    var span = writer.GetSpan(3 + Format.MaxInt32TextLen);
    span[0] = (byte)'$';
    int bytes = WriteRaw(span, totalLength, offset: 1);
    writer.Advance(bytes);

    if (prefixLength != 0) writer.Write(prefix);
    if (encodedLength != 0) WriteRaw(writer, value, encodedLength);
    WriteCrlf(writer);
   ...
}

原始碼最底層是透過 System.IO.Pipelines 中的 PipeWriter 把 Message 命令傳送到Redis伺服器的，這段程式碼比較複雜，大家先大概知道做什麼用的就行了。

到此，向Redis傳送訊息就處理完成了。

現在我們已經大概瞭解向Redis伺服器傳送訊息的過程：在最上層透過Monitor模擬了同步操作，在最底層使用了高效的非同步IO，為了適配同步和非同步，寫操作內含了兩個子操作：寫佇列和寫網路。

但是我們仍然不能回答一個問題：寫佇列和寫網路為什麼要放到一個鎖中執行？或者說為什麼要保證同時只能一個寫操作？

要回答這個問題，我們還得繼續看程式對Redis響應結果的處理。

處理Redis響應結果

Redis 客戶端與 Redis 伺服器建立連線時，會建立一個死迴圈，持續的從 System.IO.Pipelines 的管道中讀取Redis 伺服器返回的訊息，並進行相應的處理。最上層方法就是這個 ReadFromPipe：

PhysicalConnection.cs

private async Task ReadFromPipe()
{
  ...
  while (true)
  {
      ...
      // 沒有新資料從Redis伺服器返回時，ReadAsync會等在這裡
      readResult = await input.ReadAsync().ForAwait();
      ...
    
      var buffer = readResult.Buffer;
      ...
     
      if (!buffer.IsEmpty)
      {
          // 這裡邊解析資料，並賦值到相關物件上
          handled = ProcessBuffer(ref buffer);
      }
  }
}

對返回資料的處理重點在這個 ProcessBuffer 方法中。它會先對資料進行一個簡單的解析，然後再呼叫 MatchResult，從字面義上看就是匹配結果，匹配到那個結果呢？

private int ProcessBuffer(ref ReadOnlySequence<byte> buffer)
{
  ...
  var reader = new BufferReader(buffer);
  var result = TryParseResult(_protocol >= RedisProtocol.Resp3, _arena, in buffer, ref reader, IncludeDetailInExceptions, this);
  ...
  MatchResult(result);
  ...
}

還記得我們在上邊向Redis傳送Message前，先建立了一個 ResultBox 物件，匹配的就是它。

怎麼找到對應的 ResultBox 物件呢？

看下邊的程式碼，程式從佇列中取出了一個Message 例項，就是要匹配到這個 Message 例項關聯的ResultBox。

 private void MatchResult(in RawResult result)
 {
     ...

     // 從佇列中取出最早的一條Redis操作訊息
     lock (_writtenAwaitingResponse)
     {
         if (!_writtenAwaitingResponse.TryDequeue(out msg))
         {
             throw new InvalidOperationException("Received response with no message waiting: " + result.ToString());
         }
     }
     ...

     // 將Redis返回的結果設定到取出的訊息中
     if (msg.ComputeResult(this, result))
     {
         _readStatus = msg.ResultBoxIsAsync ? ReadStatus.CompletePendingMessageAsync : ReadStatus.CompletePendingMessageSync;

         // 完成Redis操作
         msg.Complete();
     }
     ...
  }

為什麼從佇列取出的 Message 就一定能對應到 Redis 伺服器當前返回的結果呢？

要破案了，還記得上邊的那個未解問題嗎：為什麼要保證同時只能一個寫操作？

我們每次操作Redis都是：先把Message壓入佇列，然後再傳送到Redis伺服器，這兩個操作緊密的繫結在一起；而Redis伺服器是單執行緒順序處理的，最先返回的就是最早壓入佇列的。加上每次只有一個寫操作的控制，我們就能保證最先寫入佇列的（也就是最先發到Redis伺服器的）Message，就能對應到最先從Redis伺服器返回的資料。

上面這段程式中的 msg.ComputeResult 就是用來將 Redis 最新返回的資料賦值到最新從佇列中拿出來的 Message 例項中。

現在 Message 例項已經獲取到了 Redis返回結果，還記得之前的傳送執行緒一直在掛起等待嗎？

下邊的 msg.Complete 就是來讓傳送執行緒恢復執行的，看這個程式碼：

Message.cs（Message）

 public void Complete()
 {
     ...
     // ResultBox啟用繼續處理
     currBox?.ActivateContinuations();
 }

還有一層封裝，繼續看這個程式碼：

ResultBox.cs（SimpleResultBox）。

 void IResultBox.ActivateContinuations()
 {
     lock (this)
     { 
         // 通知等待Redis響應的執行緒，Redis返回結果了，請繼續你的表演
         Monitor.PulseAll(this);
     }
     ...
 }

Monitor.PulseAll 一出，傳送執行緒立馬恢復執行，向呼叫方返回執行結果。

一次同步呼叫就這樣完成了。

非同步API

非同步API和同步API使用相同的通訊底層，包括寫佇列和寫網路管道的處理，只是在處理返回值的方式上存在不同。大家可以看一下非同步和同步除錯堆疊的對比圖：

StackExchange.Redis跑起來，為什麼這麼溜？

執行到 PhysicalBridge.WriteMessageInsideLock 這一步時處理就同步了。這一步的程式碼上邊也貼過了，這裡再給大家看看：其中的主要邏輯就是寫佇列和寫網路管道。

private WriteResult WriteMessageToServerInsideWriteLock(PhysicalConnection connection, Message message)
{
  ...
  // 把訊息新增到佇列
  connection.EnqueueInsideWriteLock(message);

  // 把訊息寫到網路介面
  message.WriteTo(connection);
  ...
}

向Redis傳送訊息

我們再簡單看看非同步API中是如何傳送訊息的，看程式碼：

internal Task<T?> ExecuteAsyncImpl<T>(Message? message, ResultProcessor<T>? processor, object? state, ServerEndPoint? server)
{
    ...
    // 建立一個Task執行狀態跟蹤物件
    TaskCompletionSource<T?>? tcs = null;
    
    // 建立一個ResultBox物件，這個物件將會放到Message中用來承載Redis的返回值
    // 非同步這裡特別將 ResultBox 和 TaskCompletionSource 繫結到了一起
    // 獲取到Redis伺服器返回的資料後，TaskCompletionSource 的執行狀態將被更新為完成
    IResultBox<T?>? source = null;
    if (!message.IsFireAndForget)
    {
        source = TaskResultBox<T?>.Create(out tcs, state);
    }

    // 將Message訊息傳送到 Redis伺服器
    var write = TryPushMessageToBridgeAsync(message, processor, source!, ref server);
   
    ...

    // 返回Task，呼叫方可以 await
    return tcs.Task;
}

相比同步API，這裡多建立了一個 TaskCompletionSource 的例項，它用來跟蹤非同步任務的執行狀態，程式會在接收到Redis伺服器的返回資料時，將 TaskCompletionSource 的狀態更新為完成執行。

裡邊的程式碼我就不展開講了，大家有興趣的可以按照上方我截圖的呼叫堆疊去跟蹤下。

處理Redis響應結果

非同步API和同步API使用同一個死迴圈方法：ReadFromPipe，程式啟動時也只有這一個死迴圈在執行。

程式碼上邊都講過了，這裡只說下最後“ResultBox啟用繼續處理”的部分，這個 ResultBox 和同步呼叫的 ResultBox 略有不同，看程式碼：

void IResultBox.ActivateContinuations()
{
   ...
   ActivateContinuationsImpl();
}

private void ActivateContinuationsImpl()
{
    var val = _value;
    ...
    TrySetResult(val);
    ...
}
public bool TrySetResult(TResult result)
{
    // 設定非同步任務執行完成
    bool rval = _task.TrySetResult(result);
    ...
    return rval;
}

最重要的就是 _task.TrySetResult 這句，這裡的 _task 就是發起非同步呼叫時建立的 TaskCompletionSource 例項，TrySetResult 的作用就是設定非同步任務執行完成，對應的 await 程式碼就可以繼續向下執行了。

await client.SetAsync("hello", "fireflysoft.net");

// 繼續執行下邊的程式碼
...

總結

總體執行邏輯

透過對同步API、非同步API的執行邏輯分析，我這裡總結了一張圖，可以讓大家快速的理清其中的處理邏輯。

StackExchange.Redis跑起來，為什麼這麼溜？

我再用文字描述下這個執行邏輯：

1、無論是同步呼叫還是非同步呼叫，StackExchange.Redis 底層都是先會建立一個 Message 物件；每個 Message 物件都會關聯一個ResultBox物件（同步和非同步呼叫對應的ResultBox物件略有不同），這個物件用來承載Redis執行結果；

2、然後程式會把Message存入佇列、傳送到網路IO管道，寫佇列和寫網路IO放到了一個互斥鎖中，同時只有一個Message寫入，這是為了保證收到Redis響應時正好對應佇列中的第一條資料。

執行完這些操作後，API會等待，但是同步呼叫和非同步呼叫等待的方式不同，同步會掛起執行緒等待其它執行緒同步結果，非同步會使用await等待Task執行結果；

3、Redis 命令被髮送到網路，抵達Redis伺服器

4、接收到Redis伺服器的響應資料，這些資料會放到網路IO管道中。

5、有一個執行緒持續監聽IO管道中收到的資料，一旦拿到資料，就去佇列中取出一個Message，把伺服器返回的資料寫到這個Message的ResultBox中。

給ResultBox賦值完，程式還會通知等待的API繼續執行，同步呼叫是透過執行緒通訊的方式通知，非同步呼叫是透過更新Task的執行結果狀態來通知。

最後API從ResultBox中取出資料返回給呼叫方。

管道技術

無論是同步呼叫還是非同步呼叫，它們的底層通訊方式都統一到了管道技術，這是 StackExchange.Redis 效能出類拔萃的根基，這部分就專門來介紹下。

這裡說的管道技術指的是使用System.IO.Pipelines庫，這個庫提供了一種高效的方式來最佳化流式資料處理，具備更高的吞吐量、更低的延遲。具體用途：網路上，可以用來構建高效能的TCP或UDP伺服器；對於大檔案的讀寫操作，使用Pipelines可以減少記憶體佔用，提高處理速度。

PipeWriter和PipeReader是System.IO.Pipelines中的核心元件，它們用於構建管道處理資料流。這裡分享個例子：

using System;
using System.IO.Pipelines;
using System.Text;
using System.Threading.Tasks;

class Program
{
    static async Task Main(string[] args)
    {
        // 建立一個管道
        var pipe = new Pipe();

        // 啟動一個任務來寫入資料
        var writing = FillPipeAsync(pipe.Writer);

        // 啟動一個任務來讀取資料
        var reading = ReadPipeAsync(pipe.Reader);

        await Task.WhenAll(reading, writing);
    }

    private static async Task FillPipeAsync(PipeWriter writer)
    {
        for (int i = 0; i < 5; i++)
        {
            // 寫入一些資料到管道中
            string message = $"Message {i}";
            byte[] messageBytes = Encoding.UTF8.GetBytes(message);

            // 將資料寫入管道
            Memory<byte> memory = writer.GetMemory(messageBytes.Length);
            messageBytes.CopyTo(memory);
            writer.Advance(messageBytes.Length);

            // 通知管道有資料寫入
            FlushResult result = await writer.FlushAsync();

            if (result.IsCompleted)
            {
                break;
            }

            // 模擬一些延遲
            await Task.Delay(500);
        }

        // 告訴管道我們已經完成寫入
        await writer.CompleteAsync();
    }

    private static async Task ReadPipeAsync(PipeReader reader)
    {
        while (true)
        {
            // 讀取管道中的資料
            ReadResult result = await reader.ReadAsync();
            var buffer = result.Buffer;

            // 處理讀取到的資料
            foreach (var segment in buffer)
            {
                string message = Encoding.UTF8.GetString(segment.Span);
                Console.WriteLine($"Read: {message}");
            }

            // 告訴管道我們已經處理了這些資料
            reader.AdvanceTo(buffer.End);

            // 如果沒有更多資料可以讀取，退出迴圈
            if (result.IsCompleted)
            {
                break;
            }
        }

        // 告訴管道我們已經完成讀取
        await reader.CompleteAsync();
    }
}

在這個示例中，我們建立了一個 Pipe 物件，並分別啟動了兩個任務來寫入和讀取資料：

FillPipeAsync 方法中，使用 PipeWriter 寫入資料到管道。
ReadPipeAsync 方法中，使用 PipeReader 從管道中讀取資料並處理。

透過這種方式，我們可以高效地處理流式資料，同時利用管道的優勢來提高吞吐量和降低延遲。

其實在很多的高效能IO庫中，使用的都是管道技術，比如Java的NIO、Windows的IOCP、Linux的epoll，本質上都是透過一個類似管道的東西來統籌管理資料傳輸，減少不必要的呼叫和檢查，達到高效通訊的目的。

以上就是本文的主要內容，如有問題，歡迎討論交流！

為什麼要用Redis？Redis為什麼這麼快？(來自知乎)
2020-09-23
Redis
C#是怎麼跑起來的
2021-05-23
C#
為什麼 Python 這麼慢？
2018-10-27
Python
為什麼Python這麼慢？
2018-08-14
Python
為什麼Julia這麼快？
2018-08-16
為什麼前端這麼多人
2018-04-21
前端
Redis為什麼這麼快？
2023-03-03
Redis
Nginx 為什麼這麼快？
2022-12-08
Nginx
python有什麼特性？為什麼這麼火？
2021-12-30
Python
Python是什麼?為什麼這麼搶手?
2021-07-30
Python
雲列印為什麼這麼便宜？
2024-04-24
ippswap dapp為什麼這麼火？
2023-09-27
APP
IPP SWAP】為什麼這麼火爆 ||
2023-05-08
Exadata為什麼這麼牛B
2024-05-09
為什麼 Laravel 這麼優秀
2024-01-25
Laravel
為什麼過了這麼久了
2020-10-10
快速排序為什麼這麼快？
2020-11-05
排序
Spring Boot 為什麼這麼火？
2019-06-03
Spring Boot
解析：Python為什麼這麼流行？
2021-12-08
Python
為什麼Kubernetes這麼難？ • Buttondown
2022-01-27
所以，chatGPT為什麼這麼火？
2023-02-10
ChatGPT
什麼是Python?Python為什麼這麼搶手?
2019-11-28
Python
Python能幹什麼?為什麼會這麼火?
2019-12-09
Python
等保費用是什麼？為什麼這麼貴？
2022-09-23
Web3.0是什麼，為什麼MetaVerse這麼火？
2022-01-04
WebMetaverse
六星教育：Python為什麼這麼火？未來它將會被什麼語言取代？
2020-10-24
Python
為什麼Julia語言這麼棒？
2019-02-24
為什麼凸優化這麼重要？
2019-02-25
優化
為什麼 JavaScript 的 this 要這麼用？
2019-02-28
JavaScript
為什麼這麼多人都在學Python
2018-09-12
Python
今年找工作為什麼這麼難？
2020-05-08
跑批為什麼會這麼難?
2022-08-11
為什麼HTML5這麼火？
2021-01-26
HTML
指紋登入是怎麼跑起來的
2022-01-10
為什麼不做開發做運維？Linux為什麼這麼廣泛？
2019-12-05
運維Linux
為什麼redis是單執行緒的以及為什麼這麼快？
2020-04-27
Redis執行緒
Python為什麼這麼火？學習python有什麼用？
2019-11-11
Python
Python為什麼會這麼火呢?原因是什麼？
2020-03-26
Python

StackExchange.Redis跑起來，為什麼這麼溜？

同步API

向Redis傳送訊息

處理Redis響應結果

非同步API

向Redis傳送訊息

處理Redis響應結果

總結

總體執行邏輯

管道技術

相關文章