『開源』大半夜除錯TCP延遲問題

InkFx發表於2024-03-30

原文網址 : https://www.cnblogs.com/shuxiaolong/p/18104939

背景

公司有個專案，需要一個高可用快取服務。
之前通訊技術選型時，測試過 UDP TCP HTTP QUIC gRPC 效能。

初步結論：
1、UDP 很快，CPU 很低，但無法超過 64K （大於12K 甚至都開始內網丟包）

2、HTTP 傳統的 WebApi （中規中矩的技術選型，延遲都還好，但真想完善還得每次增加 WebApi 安全驗證 —— 就開始損失效能了）

3、傳說中的 Quic，說是用UDP實現了一套類似 TCP 的重發機制（實測 CPU 增加，吞吐降低 —— 真就和本機TCP一樣了）

4、本來自己心目中最想用的是 TCP（有一套成熟的TCP庫，實戰從未失望），只需建立連線時只需一次安全驗證（目前很多資料庫、Redis、MQTT、RabbtMQ 底層都是TCP，也都是連線時安全驗證）—— 但不知道為啥，區域網跨機部署一來一回一次互動延遲達到到 100ms（經驗中：同步的一來一回 TCP 本機可以達到 5000/s ~ 7000/s）。

TCP讓我很氣餒

印象中的 TCP：

單核同步速度 5000/s ~ 7000/s
四核非同步速度可以把CPU跑滿，30000/s 都只是小意思

但這次跨機部署，每次互動 100ms 延遲（摺合 10/s 的速度 —— 這還玩毛線）

雖然多核非同步，依然能把頻寬跑滿，互動也能達到 30000/s 吞吐量 —— 但每次互動的延遲 100ms 就很不合適。

難道是我之前的專案，都只在乎吞吐量，卻沒有關注延遲的緣故？

TCP 減少延遲調優

最佳化前的現狀

本機互動 0ms，吞吐量 7000/s

虛擬機器互動 85ms，吞吐量 20/s

虛擬機器ping延遲 1ms —— ping 一來一回也就 1ms, 沒理由 TCP 一來一回 85ms 啊

使用非同步程式碼最佳化後（沒啥用）

本機互動 0ms，吞吐量 7000/s

虛擬機器互動 85ms，吞吐量 20/s

會不會是 Linux 的問題？換成 Win10 和 Win10 互動還是鳥樣

找到關鍵最佳化程式碼

虛擬機器互動 0ms

最終吞吐量 800/s

至此，執念已消，總結：

最終最佳化後的程式碼，依然選用回撥非同步

真正其決定性作用的引數是這個 NoDelay

TCP的吞吐量和延遲區別

延遲，比如一個單車道，路面坑坑窪窪一輛車一來一回 100秒，路面平整一輛車一來一回 10秒（這就是延遲）
吞吐量，比如一個 100車道，雖然路面坑坑窪窪，延遲雖高，但吞吐量依然可以很大
降低了延遲後，原本100個車道的吞吐量，只需要 10個車道即可
本文只記錄了如何降低延遲，沒有測試多併發時的吞吐量 —— 不用測，30000/s + 一定是了

小INK
2023-03-30 01:17
晚安，各位。

相關文章

分析伺服器延遲的問題
2019-11-11
伺服器
美國伺服器延遲高怎麼辦，如何解決延遲問題
2023-04-18
伺服器
MySQL之從複製延遲問題排查
2018-09-06
MySql
[20190218]延遲約束問題2.txt
2019-02-18
伺服器延遲問題如何解決
2022-06-23
伺服器
第78篇 Redis常見延遲問題
2024-12-09
Redis
疫情延遲題解
2024-10-14
定時器(setTimeout/setInterval)最小延遲的問題
2019-01-09
定時器
怎麼解決伺服器延遲問題
2022-06-21
伺服器
Google 怎麼解決長尾延遲問題
2021-05-10
Go
《RabbitMQ》| 解決訊息延遲和堆積問題
2021-11-08
MQ
Java中不要使用System.currentTimeMillis()除錯測試延遲時間
2021-06-14
Java除錯
技術分享 | OceanBase 租戶延遲刪除
2023-03-09
QWidget設定layout時的延遲重新整理問題
2020-11-05
mysql同步問題之Slave延遲很大最佳化方法
2021-09-09
MySql
ORACLE密碼錯誤驗證延遲
2019-06-27
Oracle密碼
Laravel+xdebug 除錯問題
2019-07-10
Laravel除錯
SQLServer2008 除錯問題
2019-05-11
SQLServer除錯
關於 swoole 除錯問題
2019-06-03
除錯
[20221107]除錯crontab問題.txt
2022-11-09
除錯
this問題以及 webstorm 除錯介面
2022-11-23
WebORM除錯
[譯] 讓 Apache Cassandra 尾部延遲減小 10 倍，已開源
2018-04-03
Apache
這套方法論，徹底終結MySQL同步延遲問題
2018-05-04
MySql
如何避免MYSQL主從延遲帶來的讀寫問題？
2024-03-08
MySql
教你如何解決MySQL資料延遲跳動的問題
2020-09-12
MySql
新 Uber 司機端是如何克服網路延遲問題
2019-03-04
一次 RocketMQ 順序消費延遲的問題定位
2021-07-01
MQ
VS - 打斷點/本地除錯/遠端除錯問題
2024-03-13
斷點除錯
[20190124]bbed恢復資料遇到延遲塊清除的問題.txt
2019-01-25
由於網路延遲造成邏輯鎖過期的問題
2024-11-12
MySQL主從資料庫同步延遲問題怎麼解決
2021-09-04
MySql資料庫
RabbitMQ延遲訊息的延遲極限是多少？
2019-07-23
MQ
延遲繫結
2019-03-10
VSCode除錯Flutter的問題解決
2018-10-12
VSCode除錯Flutter
Linux MIPI 除錯中常見的問題
2023-11-30
Linux除錯
直播賣貨系統開發，解決HLS實現直播過程中的延遲問題
2021-07-07
[20210529]延遲開啟資料庫.txt
2022-03-09
資料庫
[20190125]bbed恢復資料遇到延遲塊清除的問題3.txt
2019-01-25