今天，你遇到redis線上連線超時了嗎？

WindWant發表於2020-05-17

原文網址 : https://www.cnblogs.com/niejunlei/p/12900578.html

Redis

一封報警郵件，大量服務節點 redis 響應超時。

又來，好煩。

redis 響應變慢，檢視日誌，發現大量 TimeoutException。

大量TimeoutException，說明當前redis服務節點上已經堆積了大量的連線查詢，超出redis服務能力，再次嘗試連線的客戶端，redis 服務節點直接拒絕，丟擲錯誤。

那到底是什麼導致了這種情況的發生呢？

總結起來，我們可以從以下幾方面進行關注：

一、redis 服務節點受到外部關聯影響

redis服務所在伺服器，物理機的資源競爭及網路狀況等。同一臺伺服器上的服務必然面對著服務資源的競爭，CPU，記憶體，固存等。

1、CPU資源競爭

redis屬於CPU密集型服務，對CPU資源依賴尤為緊密，當所在伺服器存在其它CPU密集型應用時，必然會影響redis的服務能力，尤其是在其它服務對CPU資源消耗不穩定的情況下。

因此，在實際規劃redis這種基礎性資料服務時應該注意一下幾點：

1）一般不要和其它型別的服務進行混部。

2）同型別的redis服務，也應該針對所服務的不同上層應用進行資源隔離。

說到CPU關聯性，可能有人會問是否應該對redis服務進行CPU繫結，以降低由CPU上下文切換帶來的效能消耗及關聯影響？

簡單來說，是可以的，這種優化可以針對任何CPU親和性要求比較高的服務，但是在此處，有一點我們也應該特別注意：我們在關於redis記憶體分析，記憶體優化中介紹記憶體時，曾經提到過子程式記憶體消耗，也就是redis持久化時會fork出子程式進行AOF/RDB持久化任務。對於開啟了持久化配置的redis服務（一般情況下都會開啟），假如我們做了CPU親和性處理，那麼redis fork出的子程式則會和父程式共享同一個CPU資源，我們知道，redis持久化程式是一個非常耗資源的過程，這種自競爭必然會引發redis服務的極大不穩定。

2、記憶體不在記憶體了

關於redis記憶體分析，記憶體優化開篇就講過，redis最重要的東西，記憶體。

記憶體穩定性是redis提供穩定，低延遲服務的最基本的要求。

然而，我們也知道作業系統有一個 swap 的東西，也就將記憶體交換到硬碟。假如發生了redis記憶體被交換到硬碟的情景發生，那麼必然，redis服務能力會驟然下降。

swap發現及避免：

1）info memory：

關於redis記憶體分析，記憶體優化中我們也講過，swap這種情景，此時，檢視redis的記憶體資訊，可以觀察到碎片率會小於1。這也可以作為監控redis服務穩定性的一個指標。

2）通過redis程式檢視。

首先通過 info server 獲取程式id：

檢視 redis 程式 swap 情況：cat /proc/1686/smaps

確定交換量都為0KB或者4KB。

3）redis服務maxmemory配置。

關於redis記憶體分析，記憶體優化中我們提到過，對redis服務必要的記憶體上限配置，這是記憶體隔離的一種必要。需要確定的是所有redis例項的分配記憶體總額小於總的可用實體記憶體。

4）系統優化：

另外，在最初的基礎服務作業系統安裝部署時，也需要做一些必要的前置優化，如關閉swap或配置系統儘量避免使用。

3、網路問題

網路問題，是一個普遍的影響因素。

1）網路資源耗盡

簡單來說，就是頻寬不夠了，整個屬於基礎資源架構的問題了，對網路資源的預估不足，跨機房，異地部署等都會成為誘因。

2）連線數用完了

一個客戶端連線對應著一個TCP連線，一個TCP連線在LINUX系統內對應著一個檔案控制程式碼，系統級別連線控制程式碼用完了，也就無法再進行連線了。

檢視當前系統限制：ulimit -n

設定：ulimit -n {num}

3）埠TCP backlog佇列滿了

linux系統對於每個埠使用backlog儲存每一個TCP連線。

redis配置：tcp_backlog 預設511

高併發情境下，可以適當調整此配置，但需要注意的是，同時要調整系統相關設定。

系統修改命令：echo {num}>/proc/sys/net/core/somaxconn

檢視因為佇列溢位導致的連線絕句：netstat -s | grep overflowed

4）網路延遲

網路質量問題，可以使用 redis-cli 進行網路狀況的測試：

延遲測試：redis-cli -h {host} -p {port} --latency

取樣延遲測試：redis-cli -h {host} -p {port} --latency-history 預設15s一次

圖形線上測試結果：redis-cli -h {host} -p {port} --latency-dist

4）網路卡軟中斷

單個網路卡佇列只能使用單個CPU資源問題。

二、redis 服務使用問題

1、慢查詢

如果你的查詢總是慢查詢，那麼必然你的使用存在不合理。

1）你的key規劃是否合理

太長或太短都是不建議的，key需要設定的簡短而有意義。

2）值型別選擇是否合理。

hash還是string，set還是zset，避免大物件儲存。

線上可以通過scan命令進行大物件發現治理。

3）是否能夠批查詢

get 還是 mget；是否應該使用pipeline。

4）禁止線上大資料量操作

2、redis 服務執行狀況

檢視redis服務執行狀況：redis-cli -h {host} -p {port} --stat

keys：當前key總數；mem：記憶體使用；clients：當前連線client數；blocked：阻塞數；requests：累計請求數；connections：累計連線數

3、持久化操作影響

1）fork子程式影響

redis 進行持久化操作需要fork出子程式。fork子程式本身如果時間過長，則會產生一定的影響。

檢視命令最近一次fork耗時：info stats

單位微妙，確保不要超過1s。

2）AOF刷盤阻塞

AOF持久化開啟，後臺每秒進行AOF檔案刷盤操作，系統fsync操作將AOF檔案同步到硬碟，如果主執行緒發現距離上一次成功fsync超過2s，則會阻塞後臺執行緒等待fsync完成以保障資料安全性。

3）THP問題

關於redis記憶體分析，記憶體優化中我們講過透明大頁問題，linux系統的寫時複製機制會使得每次寫操作引起的頁複製由4KB提升至2M從而導致寫慢查詢。如果慢查詢堆積必然導致後續連線問題。

Redis連線超時排查實錄
2024-04-03
Redis
關於在執行java連線MongoDB時遇到的連線超時問題
2018-11-06
JavaMongoDB
今天你打牌了嗎？《陰陽師：百聞牌》已上線App Store
2019-12-06
APP
python 連線 mongo 資料庫連線超時
2018-07-03
PythonGo資料庫
今天你過節了嗎？
2024-05-21
今天你進步了嗎？
2019-09-06
QPS過萬，redis大量連線超時怎麼解決？
2020-08-23
Redis
PostgreSQL 連線超時異常
2024-01-05
SQL
Problem C: 你過線了嗎？
2020-12-19
今天，你web3了嗎
2022-01-07
Web
解決代理連線超時問題
2023-11-21
應用連線超時排查DB MySQL
2020-04-22
MySql
今天你劉畊巨集了嗎？智慧數字經營系統帶你玩轉線上運動
2022-06-07
網路超時控制 + 指數補償法超時連線
2024-08-20
【Azure Redis】Lettuce客戶端遇見連線Azure Redis長達15分鐘的超時
2024-03-14
Redis客戶端
使用telnet連線redis
2018-09-15
Redis
Laravel redis 連不同的連線
2021-03-09
LaravelRedis
你們心心念唸的《CD2：陷阱大師》EA版今天終於上線了
2023-11-13
上線兩年後，Epic商店趕上Steam了嗎？
2020-12-30
FileZilla 連結伺服器提示 20 秒連線超時
2024-03-24
伺服器
windwos 使用telnet 連線 redis
2018-05-30
Redis
go~連線redis的方法
2024-04-03
GoRedis
Redis 可以讓工具連線
2019-05-15
Redis
Springboot 連線池wait_timeout超時設定
2018-05-27
Spring BootAI
解決laravel 連線不上docker 安裝的redis
2021-05-12
LaravelDockerRedis
ServiceStack.Redis的原始碼分析（連線與連線池）
2022-02-21
Redis原始碼
試試這幾招讓你的導購線上變身連線顧客的“超級個體”
2020-03-26
大話設計模式：今天你設計了嗎？
2022-01-24
設計模式
聯瑞電子：今天你出示行程碼了嗎？
2022-07-01
行程
印表機離線了怎麼連線印表機離線的連線方法
2022-01-07
PhpStrom連線線上伺服器
2020-12-31
PHP伺服器
連線zk 報錯連線不上hbase jdbc
2020-10-25
JDBC
win10系統下ftp連線失敗提示“連線已超時”怎麼辦
2019-06-06
Win10FTP
Linux上Redis使用視覺化工具RedisDesktopManager遠端連線不上
2020-09-25
LinuxRedis視覺化
連線mysql時提示is not allowed to connect不允許連線
2024-07-13
MySql
Feign，HTTP連線超時問題SocketTimeoutException: Read timed out
2020-10-10
HTTPException
使用secureCRT連線伺服器，防超時斷開
2018-03-19
Securecrt伺服器
pymysql 處理連線超時最好的解決方案
2021-10-07
MySql