雲端計算之路-阿里雲上：對“黑色30秒”問題的猜想

部落格園團隊發表於2014-04-24

原文網址 : https://www.cnblogs.com/cmt/p/3685134.html

在雲上，底層的東西你無法觸及，遇到奇怪問題時只能靠猜想，所以使用雲端計算會鍛鍊你的想像力。

黑色30秒

（上圖中藍色是ASP.NET的Requests Queued，另外一個是HTTP.SYS的Arrival Rate）

昨天我們發現了一個重要的線索——“黑色30秒”到來時，最初的表現是請求出現排隊（Requests Queued上升），到達IIS的請求數量（Arrival Rate）下降。

而問題奇特之處就在Arrival Rate下降。如果只是Requests Queued上升，而Arrival Rate處於正常水平，我們首先會懷疑應用程式的原因——應用程式在處理請求時卡在哪個地方；而Requests Queued上升伴隨著Arrival Rate下降，說明不僅後面出不去（請求完成不了），而且前面進不來（請求到達不了IIS）。應用程式不管出什麼樣的問題，都不可能造成Arrival Rate下降，所以我們目前找不到任何理由去懷疑應用程式。

於是，我們針對“前面請求進不來，後面請求出不去”展開了風花雪月的想像，終於找到了一個看上去說得通的猜想，下面分享一下。

*先看一下使用者的請求是如何到達Web伺服器的？

使用者瀏覽器 -> SLB（阿里雲負載均衡） -> VM（虛擬機器）-> Web伺服器

*再看Web伺服器如何將響應傳送給使用者的？

Web伺服器 -> VM -> SLB -> 使用者瀏覽器

【猜想】

假設SLB或VM在某種觸發條件下，偷偷地斷掉了一些TCP連線，並且不向使用者端與服務端傳送 FIN 或者 RST 報文，除了肇事者，誰也不知道。於是：

1）使用者端不知道TCP連線被斷，還繼續用這個TCP連線發包，結果請求當然到不了Web伺服器，造成Arrival Rate下降。使用者端TCP層發包後，等回包（比如ACK包），遲遲等不到，一直等到超時（假設超時時間是30s），才知道TCP鏈路掛掉了；然後重建TCP連線重發請求，這時請求成功到達了Web伺服器，當前的請求+之前被斷連線的請求一起到達Web伺服器，這正好解釋了“黑色30秒”結束階段Arrival Rate會突增到一個高點。

2）Web伺服器端與SLB端（或者SLB端與使用者端）的TCP連線被斷，Web伺服器不知道，在處理完請求後還繼續用這個斷掉的TCP連線傳送響應包並等回包，遲遲等不到，造成請求處理不能完成而被堆積，從而進一步造成後續的請求沒有足夠的資源可用而排隊，於是Requests Queued上升；一直等到超時（假設超時時間是30s），Web伺服器才知道TCP鏈路掛掉了，然後放棄這些請求處理，於是有了足夠的資源處理佇列中的請求，這正好解釋了“黑色30秒”結束階段Requests Queued會突降。

這就是我們目前找到的唯一能解釋得通“黑色30秒”問題表現的一個猜想。

雲端計算40個問題
2019-03-22
AI之旅-開篇：從雲端計算之路到AI之旅，從搬上阿里雲到留在阿里雲
2024-10-27
AI阿里
阿里雲函式計算域名配置問題
2024-04-04
阿里函式
企業該如何應對雲端計算中安全問題
2019-05-14
阿里雲OOS上傳問題
2018-07-05
阿里
雲端計算面試題及答案，AWS雲端計算面試題
2019-06-19
面試題
阿里雲如何二次驅動雲端計算
2019-02-18
阿里
好程式設計師雲端計算教程分享Linux雲端計算面試常見問題一
2019-11-11
程式設計師Linux面試
好程式設計師雲端計算教程分享Linux雲端計算面試常見問題二
2019-11-12
程式設計師Linux面試
好程式設計師雲端計算教程分享Linux雲端計算面試常見問題三
2019-11-12
程式設計師Linux面試
雲端計算每日一題
2018-09-21
每日一題
雲端計算面試題及答案，雲端計算崗位精品面試題
2019-06-18
面試題
雲端計算對生活有什麼影響？學習linux雲端計算
2020-12-14
Linux
雲端計算之路-出海記：命令列下的 AWS
2020-11-11
命令列
阿里巴巴叔同談雲原生和雲端計算
2019-12-16
阿里
OpenStack及雲端計算（面試）常見問題
2020-07-18
面試
雲端計算工程師面試題集錦，雲端計算面試題及答案
2019-06-18
工程師面試題
Linux雲端計算面試題第二彈，樂視雲端計算面試題
2019-05-20
Linux面試題
雲端計算面試題及答案，雲端計算工程師面試題集錦
2019-05-28
面試題工程師
常見的雲端計算安全問題以及如何解決
2022-07-29
雲端計算面試題及答案，雲端計算主要就業崗位
2019-06-20
面試題就業
雲端計算進階之路——與ACE相約
2018-09-29
SQL Server與雲端計算（上）UH
2022-03-21
SQLServer
Linux運維對雲端計算有影響嗎？雲端計算需求怎麼樣？
2020-12-10
Linux運維
雲端計算的前身
2019-05-11
雲端計算的前景
2021-02-26
雲端計算之雲的分類
2023-12-11
雲端計算：雲端計算是怎麼分類的？
2019-08-02
雲端計算工程師面試題集錦，常見雲端計算面試題及答案
2020-02-08
工程師面試題
雲端計算大資料面試題，雲端計算大資料面試題集錦
2019-06-19
大資料面試題
雲端計算面試題筆試錦集，雲端計算實用面試題答案二
2019-05-29
面試題筆試
雲端計算面試題筆試錦集，雲端計算實用面試題答案一
2019-05-29
面試題筆試
【雲端計算小知識】什麼是雲端計算？雲端計算特點是什麼？
2021-12-03
雲端計算之路-新篇章-出海記：開篇
2020-10-30
雲端計算之路-出海記：蹭一張 aws 船票
2020-11-02
什麼叫雲端計算？雲端計算通俗解釋
2018-07-09
雲端計算每日一題（NO.0009)
2018-10-09
每日一題
雲端計算每日一題（NO.0002)
2018-09-25
每日一題
高薪崗位雲端計算面試題，雲端計算運維工程師必備
2019-05-09
高薪面試題運維工程師

雲端計算之路-阿里雲上：對“黑色30秒”問題的猜想

相關文章