透過一個示例形象地理解C# async await 非並行非同步、並行非同步、並行非同步的併發量控制

0611163發表於2023-02-04

前言

接上一篇透過一個示例形象地理解C# async await非同步
我在 .NET與大資料中吐槽前同事在雙層迴圈體中(肯定是單執行緒了)頻繁請求es，導致介面的總耗時很長。這不能怪前同事，確實難寫，會使程式碼複雜度增加。
評論區有人說他的理解是使用非同步增加了系統吞吐能力，這個理解是正確的，但對於單個介面的單次請求而言，它是單執行緒的，耗時反而可能比同步還慢。如何縮短單個介面的單次請求的時間呢(要求：儘量不增加程式碼複雜度)？請看下文。

示例的測試步驟

先直接測試，看結果，下面再放程式碼

點選VS2022的啟動按鈕，啟動程式，它會先啟動Server工程，再啟動AsyncAwaitDemo2工程
分別點選三個button
觀察思考輸出結果

測試截圖

非並行非同步(順序執行的非同步)

截圖說明：單次請求耗時約0.5秒，共10次請求，耗時約 0.5秒×10=5秒

並行非同步

截圖說明：單次請求耗時約0.5秒，共10次請求，耗時約 0.5秒

並行非同步(控制併發數量)

截圖說明：單次請求耗時約0.5秒，共10次請求，併發數是5，耗時約 0.5秒×10÷5=1秒

服務端
服務端和客戶端是兩個獨立的工程，測試時在一起跑，但其實可以分開部署，部署到不同的機器上
服務端是一個web api介面，用.NET 6、VS2022開發，程式碼如下：

[ApiController]
[Route("[controller]")]
public class TestController : ControllerBase
{
    [HttpGet]
    [Route("[action]")]
    public async Task<Dictionary<int, int>> Get(int i)
    {
        var result = new Dictionary<int, int>();

        await Task.Delay(500); //模擬耗時操作

        if (i == 0)
        {
            result.Add(0, 5);
            result.Add(1, 4);
            result.Add(2, 3);
            result.Add(3, 2);
            result.Add(4, 1);
        }
        else if (i == 1)
        {
            result.Add(0, 10);
            result.Add(1, 9);
            result.Add(2, 8);
            result.Add(3, 7);
            result.Add(4, 6);
        }

        return result;
    }
}

客戶端
大家看客戶端程式碼時，不需要關心服務端怎麼寫
客戶端是一個Winform工程，用.NET 6、VS2022開發，程式碼如下：

public partial class Form1 : Form
{
    private readonly string _url = "http://localhost:5028/Test/Get";

    public Form1()
    {
        InitializeComponent();
    }

    private async void Form1_Load(object sender, EventArgs e)
    {
        //預熱
        HttpClient httpClient = HttpClientFactory.GetClient();
        await (await httpClient.GetAsync(_url)).Content.ReadAsStringAsync();
    }

    //非並行非同步(順序執行的非同步)
    private async void button3_Click(object sender, EventArgs e)
    {
        await Task.Run(async () =>
        {
            Log($"==== 非並行非同步 開始，執行緒ID={Thread.CurrentThread.ManagedThreadId} ========================");
            Stopwatch sw = Stopwatch.StartNew();
            HttpClient httpClient = HttpClientFactory.GetClient();
            var tasks = new Dictionary<string, Task<string>>();
            StringBuilder sb = new StringBuilder();
            for (int i = 0; i < 2; i++)
            {
                int sum = 0;
                for (int j = 0; j < 5; j++)
                {
                    Dictionary<int, int> dict = await RequestAsync(_url, i);
                    if (dict.ContainsKey(j))
                    {
                        int num = dict[j];
                        sum += num;
                        sb.Append($"{num}, ");
                    }
                }
                Log($"輸出：sum={sum}");
            }
            Log($"輸出：{sb}");
            sw.Stop();
            Log($"==== 結束，執行緒ID={Thread.CurrentThread.ManagedThreadId}，耗時：{sw.Elapsed.TotalSeconds:0.000}秒 ========================");
        });
    }

    // 並行非同步
    private async void button4_Click(object sender, EventArgs e)
    {
        await Task.Run(async () =>
        {
            Log($"==== 並行非同步 開始，執行緒ID={Thread.CurrentThread.ManagedThreadId} ========================");
            Stopwatch sw = Stopwatch.StartNew();
            HttpClient httpClient = HttpClientFactory.GetClient();
            var tasks = new Dictionary<string, Task<Dictionary<int, int>>>();
            StringBuilder sb = new StringBuilder();
            //雙層迴圈寫第一遍
            for (int i = 0; i < 2; i++)
            {
                for (int j = 0; j < 5; j++)
                {
                    var task = RequestAsync(_url, i);
                    tasks.Add($"{i}_{j}", task);
                }
            }
            //雙層迴圈寫第二遍
            for (int i = 0; i < 2; i++)
            {
                int sum = 0;
                for (int j = 0; j < 5; j++)
                {
                    Dictionary<int, int> dict = await tasks[$"{i}_{j}"];
                    if (dict.ContainsKey(j))
                    {
                        int num = dict[j];
                        sum += num;
                        sb.Append($"{num}, ");
                    }
                }
                Log($"輸出：sum={sum}");
            }
            Log($"輸出：{sb}");
            sw.Stop();
            Log($"==== 結束，執行緒ID={Thread.CurrentThread.ManagedThreadId}，耗時：{sw.Elapsed.TotalSeconds:0.000}秒 ========================");
        });
    }

    // 並行非同步(控制併發數量)
    private async void button5_Click(object sender, EventArgs e)
    {
        await Task.Run(async () =>
        {
            Log($"==== 並行非同步(控制併發數量) 開始，執行緒ID={Thread.CurrentThread.ManagedThreadId} ===================");
            Stopwatch sw = Stopwatch.StartNew();
            HttpClient httpClient = HttpClientFactory.GetClient();
            var tasks = new Dictionary<string, Task<Dictionary<int, int>>>();
            Semaphore sem = new Semaphore(5, 5);
            StringBuilder sb = new StringBuilder();
            //雙層迴圈寫第一遍
            for (int i = 0; i < 2; i++)
            {
                for (int j = 0; j < 5; j++)
                {
                    var task = RequestAsync(_url, i, sem);
                    tasks.Add($"{i}_{j}", task);
                }
            }
            //雙層迴圈寫第二遍
            for (int i = 0; i < 2; i++)
            {
                int sum = 0;
                for (int j = 0; j < 5; j++)
                {
                    Dictionary<int, int> dict = await tasks[$"{i}_{j}"];
                    if (dict.ContainsKey(j))
                    {
                        int num = dict[j];
                        sum += num;
                        sb.Append($"{num}, ");
                    }
                }
                Log($"輸出：sum={sum}");
            }
            sem.Dispose(); //別忘了釋放
            Log($"輸出：{sb}");
            sw.Stop();
            Log($"==== 結束，執行緒ID={Thread.CurrentThread.ManagedThreadId}，耗時：{sw.Elapsed.TotalSeconds:0.000}秒 ========================");
        });
    }

    private async Task<Dictionary<int, int>> RequestAsync(string url, int i)
    {
        Stopwatch sw = Stopwatch.StartNew();
        HttpClient httpClient = HttpClientFactory.GetClient();
        var result = await (await httpClient.GetAsync($"{url}?i={i}")).Content.ReadAsStringAsync();
        sw.Stop();
        Log($"執行緒ID={Thread.CurrentThread.ManagedThreadId}，請求耗時：{sw.Elapsed.TotalSeconds:0.000}秒");
        return JsonSerializer.Deserialize<Dictionary<int, int>>(result);
    }

    private async Task<Dictionary<int, int>> RequestAsync(string url, int i, Semaphore semaphore)
    {
        semaphore.WaitOne();
        try
        {
            Stopwatch sw = Stopwatch.StartNew();
            HttpClient httpClient = HttpClientFactory.GetClient();
            var result = await (await httpClient.GetAsync($"{url}?i={i}")).Content.ReadAsStringAsync();
            sw.Stop();
            Log($"執行緒ID={Thread.CurrentThread.ManagedThreadId}，請求耗時：{sw.Elapsed.TotalSeconds:0.000}秒");
            return JsonSerializer.Deserialize<Dictionary<int, int>>(result);
        }
        catch (Exception ex)
        {
            Log($"錯誤：{ex}");
            throw;
        }
        finally
        {
            semaphore.Release();
        }
    }

    #region Log
    private void Log(string msg)
    {
        msg = $"{DateTime.Now.ToString("yyyy-MM-dd HH:mm:ss.fff")}  {msg}\r\n";

        if (this.InvokeRequired)
        {
            this.BeginInvoke(new Action(() =>
            {
                txtLog.AppendText(msg);
            }));
        }
        else
        {
            txtLog.AppendText(msg);
        }
    }
    #endregion

    private void button6_Click(object sender, EventArgs e)
    {
        txtLog.Text = string.Empty;
    }
}

思考

1. Semaphore的使用要小心

這裡是Winform，它是在button事件中定義的區域性變數，如果是WebAPI介面，那就在介面方法中定義Semaphore區域性變數。可造成別定義成全域性的，或者定義成靜態的，或者定義成Controller的成員變數，那樣會嚴重限制使用它的介面的吞吐能力！
用完呼叫Dispose釋放

2. 儘量不增加程式碼複雜度

請思考程式碼中的註釋"雙層迴圈寫第一遍""雙層迴圈寫第二遍"，這個寫法儘量不增加程式碼複雜度，試想一下，如果你用Task.Run且不說佔用執行緒，就問你怎麼寫能簡單？
有人說，我會，這樣寫不就行了：

Dictionary<int, int>[] result = await Task.WhenAll(tasks.Values);

那請問，你接下來怎麼寫？我相信你肯定會寫，但問題是，程式碼的邏輯結構變了，程式碼複雜度增加了！
所以"雙層迴圈寫第一遍""雙層迴圈寫第二遍"是什麼意思？你即能方便合併，又能方便拆分，程式碼邏輯結構沒變，只是複製了一份。

3. RequestAsync的複雜度可控

RequestAsync的複雜度並沒有因為Semaphore的引入變得更復雜，增加的程式碼可以接受。

我寫這篇部落格不是空穴來風，不只是寫個Demo，我確實有實際專案中的問題需要解決，程式碼如下：

WebAPI的Controller層：

[HttpPost]
[Route("[action]")]
public async Task<List<NightActivitiesResultItem>> Get([FromBody] NightActivitiesPostData data)
{
    return await ServiceFactory.Get<NightActivitiesService>().Get(data.startDate, data.endDate, data.startTime, data.endTime, data.threshold, data.peopleClusters);
}

WebAPI的Service層：

public async Task<List<NightActivitiesResultItem>> Get(string strStartDate, string strEndDate, string strStartTime, string strEndTime, decimal threshold, List<PeopleCluster> peopleClusterList)
{
    List<NightActivitiesResultItem> result = new List<NightActivitiesResultItem>();

    DateTime startDate = DateTime.ParseExact(strStartDate, "yyyyMMdd", CultureInfo.InvariantCulture);
    DateTime endDate = DateTime.ParseExact(strEndDate, "yyyyMMdd", CultureInfo.InvariantCulture);
    string[][] strTimes;
    if (string.Compare(strStartTime, strEndTime) > 0)
    {
        strTimes = new string[2][] { new string[2], new string[2] };
        strTimes[0][0] = strStartTime;
        strTimes[0][1] = "235959";
        strTimes[1][0] = "000000";
        strTimes[1][1] = strEndTime;
    }
    else
    {
        strTimes = new string[1][] { new string[2] };
        strTimes[0][0] = strStartTime;
        strTimes[0][1] = strEndTime;
    }

    foreach (PeopleCluster peopleCluster in peopleClusterList)
    {
        for (DateTime day = startDate; day <= endDate; day = day.AddDays(1))
        {
            string strDate = day.ToString("yyyyMMdd");
            int sum = 0;
            foreach (string[] timeArr in strTimes)
            {
                List<PeopleFeatureAgg> list = await ServiceFactory.Get<PeopleFeatureQueryService>().QueryAgg(strDate + timeArr[0], strDate + timeArr[1], peopleCluster.ClusterIds);
                Dictionary<string, int> agg = list.ToLookup(a => a.ClusterId).ToDictionary(a => a.Key, a => a.First().Count);

                foreach (string clusterId in peopleCluster.ClusterIds)
                {
                    if (agg.TryGetValue(clusterId, out int count))
                    {
                        sum += count;
                    }
                }
            }
            if (sum >= threshold) //大於或等於閾值
            {
                NightActivitiesResultItem item = new NightActivitiesResultItem();
                item.peopleCluster = peopleCluster;
                item.date = strDate;
                item.count = sum;
                foreach (string[] timeArr in strTimes)
                {
                    PeopleFeatureQueryResult featureList = await ServiceFactory.Get<PeopleFeatureQueryService>().Query(strDate + timeArr[0], strDate + timeArr[1], peopleCluster.ClusterIds, 10000);
                    item.list.AddRange(featureList.list);
                }
                item.dataType = "xxx";
                result.Add(item);
            }
        }
    }

    var clusters = result.ConvertAll<PeopleCluster>(a => a.peopleCluster);
    await ServiceFactory.Get<PersonScoreService>().Set(OpeType.Xxx, peopleClusterList, clusters, startDate.ToString("yyyyMMddHHmmss"), endDate.ToString("yyyyMMddHHmmss"));

    return result;
}

思考

上述介面程式碼，它有三層迴圈，在第三層迴圈體中await，第一層迴圈的數量會達到1000甚至10000，第二層迴圈的數量會達到30(一個月30天)，甚至90(三個月)，第三層迴圈的數量很少。
那麼總請求次數會達到3萬甚至90萬，如果不使用並行非同步請求，那耗時將會很長。

請問：在儘量不增加程式碼複雜度的前提下，怎麼最佳化，縮短該服務介面的執行時間？
我知道肯定有人要說我了，你傻啊，請求3萬次？你可以改寫，只請求一次，或者按天來，每天的資料只請求一次，那最多也才90次。然後在記憶體中計算，這不就快了？
確實是這樣的，確實不應該請求3萬次。但問題沒這麼簡單：

且不說程式碼的複雜度，程式碼的複雜度你們自己想。你寫的也不是一個介面，你可能會有幾十個這樣的介面要寫，複雜度增加一點這麼多介面都要寫死人。
這3萬請求，可都是精確查詢，es強大的快取機制，肯定會命中快取，也就是這些請求實際上基本是直接從記憶體中拿資料，連遍歷集合都不需要，直接命中索引。只是網路往返次數太多。
你這1次請求，或30次請求，對es來說，變成了範圍查詢，es要遍歷，要給你查詢並組織資料，返回集合給你。當然es叢集的運算速度肯定很快。
你1次請求，或30次請求，那結果返回後，你就要在記憶體中計算了，我有的介面就是這樣寫的，但要多寫程式碼，比如在記憶體中計算，為了提高效率，先建立字典相當於建索引。
只是邏輯複雜了嗎？你還要多定義一些臨時的變數啊！
程式碼寫著寫著就變懶了，每個介面1次請求，然後在記憶體中再遍歷再計算，心智負擔好重
我在網上看到es叢集預設最多支援10000個併發查詢，需要請求es的業務程式肯定不止一個，對一個業務程式而言，確實要控制併發量
根據我的觀察，一個WebAPI程式，執行緒數一般也就幾十，多的時候上百，在沒有非同步的時候，併發請求數量實際上受限於物理執行緒。
使用非同步之後，併發請求數量實際上受限於虛擬執行緒。確實會增加請求es的併發數量，壓力大的時候，這個併發數量能達到多少，還需要研究，以進一步確定，怎麼限制併發數量。也許可以搞個全域性的Semaphore sem = new Semaphore(500, 500);來限制一下總的es請求併發量。

怎麼檢視併發請求數

windows的cmd命令：
netstat -ano | findstr 5028

所以，上述並行非同步不能濫用

所以，上述並行非同步不能濫用，需要根據實際情況，確定，是否按這種方式最佳化。

還有兩個問題，部落格中沒有體現

1. 客戶端程式執行請求時，客戶端執行緒數量

非並行非同步，執行緒數很少了，請求開始後只增加了一兩個執行緒。並行非同步執行緒數較多。並行非同步並控制併發量的活，執行緒數相對少一些。

2. Semaphore不要輕易使用

semaphore.WaitOne()阻塞執行緒一直阻塞到semaphore.Release()，而一個WepAPI服務程式一般也就幾十上百個物理執行緒，想象一下，如果你這個使用semaphore的介面被大量請求，你的WebAPI程式的吞吐量會怎麼樣？會不會慘不忍睹。

思考

.NET只有一個CLR執行緒池和一個非同步執行緒池(完成埠執行緒池)，當執行緒池中執行緒數量不夠用時，.NET每秒才增加1到2個執行緒，執行緒增加的速度非常緩慢。結合非同步，考慮一下這是為什麼？
我認為(不一定對)：

非同步不需要大量物理執行緒，少量即可
如果執行緒增加速度很快，以非同步的吞吐量，怕不是要把es請求掛！因為併發請求數太多了。
使用並行非同步時，.NET底層本身會不會對併發量有所限制？或者非同步的排程非常講究？就像執行緒池那樣，實際上1秒只增加1到2個執行緒。

總結

並行非同步，會有併發量太大，導致諸如資料庫或者es叢集抗不住的問題，謹慎使用。
並行非同步(控制併發數量)，併發量控制住了，但Semaphore會阻塞執行緒！導致整個程式的吞吐量下降。不過寫客戶端程式的話，應該好使。

完整測試原始碼

注意是AsyncParallel分支
https://gitee.com/s0611163/AsyncAwaitDemo2/tree/AsyncParallel/

最後

我努力嘗試，可能並沒有解決我想解決的問題，倒是可以幫助大家理解非同步、並行、併發。
上述我寫的實際介面，耗時長沒有問題，還有很多服務介面，它們透過定時任務在凌晨錯開時間跑，結果儲存在資料庫中供前端查詢。這是離線分析。
前同事寫的介面是實時的，所以他覺得es慢了，如果只請求一次呢，可能es的查詢語句也不好寫，所以用ClickHouse，利用SQL靈活性，只查詢一次，然後在記憶體中計算。

程式執行緒、同步非同步、阻塞非阻塞、併發並行
2020-03-02
執行緒非同步並行
♻️同步和非同步；並行和併發；阻塞和非阻塞
2024-06-09
非同步並行
【OS】同步非同步/阻塞非阻塞、併發並行序列的區分
2019-03-30
非同步並行
程式與執行緒、同步與非同步、阻塞與非阻塞、併發與並行
2019-05-22
執行緒非同步並行
透過一個示例形象地理解C# async await非同步
2023-01-30
C#AI非同步
11、協程和io教程01 -- 併發並行同步非同步阻塞非阻塞以及 IO多路複用
2020-11-13
並行非同步
併發-0-同步/非同步/阻塞/非阻塞/程式/執行緒
2018-10-17
非同步執行緒
同步、非同步，阻塞、非阻塞理解
2019-01-19
非同步
理解阻塞、非阻塞、同步、非同步
2021-08-16
非同步
對執行緒、協程和同步非同步、阻塞非阻塞的理解
2021-03-23
執行緒非同步
Golang非CSP併發模型外的其他並行方法總結
2018-12-22
Golang模型並行
同步非同步，阻塞非阻塞
2020-03-20
非同步
非同步、同步、阻塞、非阻塞
2020-10-28
非同步
執行緒，程式，協程，併發，並行，同步，非同步概念解析
2020-04-06
執行緒並行非同步
非同步/同步,阻塞/非阻塞,單執行緒/多執行緒概念梳理
2019-02-25
非同步執行緒
同步、非同步、阻塞與非阻塞
2018-07-30
非同步
同步非同步與阻塞非阻塞
2019-09-18
非同步
聊聊執行緒與程式 & 阻塞與非阻塞 & 同步與非同步
2019-03-01
執行緒非同步
java同步非阻塞IO
2018-07-02
Java
同步、非同步、阻塞、非阻塞的區別
2018-12-03
非同步
怎樣理解阻塞非阻塞與同步非同步的區別？
2019-02-16
非同步
iOS執行緒、同步非同步、序列並行佇列
2018-06-19
iOS執行緒非同步並行佇列
IO - 同步非同步阻塞非阻塞的區別
2018-05-12
非同步
對於同步、非同步、阻塞、非阻塞的幾點淺薄理解
2018-08-29
非同步
一文講明白Java中執行緒與程序、併發與並行、同步與非同步
2024-03-05
Java執行緒並行非同步
同步阻塞、同步非阻塞、多路複用的介紹
2023-02-01
徹底搞懂同步非同步與阻塞非阻塞
2023-02-15
非同步
非同步和並行的區別
2023-12-12
非同步並行
Javascript 閉包並非魔法
2018-03-28
JavaScript
java 非同步並行框架 async-01-入門教程
2019-03-12
Java非同步並行框架
Jupyter可能並非理想的Notebook
2019-03-09
【理解ES7async/await並實現】手把手進行ES6非同步程式設計：Generator + Promise = Async/Await
2019-04-19
AI非同步程式設計Promise
一篇文章讀懂阻塞，非阻塞，同步，非同步
2018-05-14
非同步
快速理解併發、並行
2019-04-21
並行
探索：優雅地實現非同步方法的並行化
2023-02-09
非同步並行
Java 非阻塞 IO 和非同步 IO
2018-11-14
Java非同步
大白話搞懂什麼是同步/非同步/阻塞/非阻塞
2019-04-17
非同步
socket阻塞與非阻塞，同步與非同步、I/O模型
2023-05-18
非同步模型