雲端計算之路-阿里雲上：結合IIS日誌分析“黑色30秒”問題

部落格園團隊發表於2014-04-25

在昨天針對“黑色30秒”問題的分析中，我們猜測Requests Queued上升是由於正在處理的請求出不去（到達不了客戶端）。今天我們結合IIS日誌驗證這個猜測。

IIS日誌中有一個重要的指標——time-taken，time-taken不僅包含了請求在服務端執行的時間，還包含了響應的內容從服務端到達客戶端的時間（詳見以下的引用內容）。

Beginning in IIS 6.0, the time-taken field typically includes network time. Before HTTP.sys logs the value in the time-taken field, HTTP.sys usually waits for the client to acknowledge the last response packet send operation or HTTP.sys waits for the client to reset the underlying TCP connection. Therefore, when a large response or large responses are sent to a client over a slow network connection, the value of the time-taken field may be more than expected.

計算time-taken的結束時間是在HTTP.sys將響應內容傳送給客戶端之後，等到客戶端發來確認包或者客戶端重置了TCP連線。

另外，“黑色30秒”只在訪問高峰期出現，我們覺得“黑色30秒”可能是某種小問題在高併發時的放大。

所以，今天我結合IIS日誌分析了一些小波動情況。下面是分析的情況：

1）13:47:13效能監視器中出現耗時562ms的請求

2）根據time-taken的計算方法，這個請求的time-taken肯定大於562ms，所以我們就在IIS日誌中找對應的記錄。

上圖就是這個請求在IIS日誌中的記錄，05:47:15是GMT時間，對應的北京時間是13:47:15。

time-taken竟然比Request Execution Time多了2秒多（2640ms），13:47:13 ASP.NET執行完請求傳送給客戶端之後，2秒之後才收到客戶端的確認包。

再看看13:47:15，效能監視器中究竟發生了什麼？

3）Requests Queued飆升

4）Arrival Rate突降

5）CPU消耗突降

6）Current Connections在上升，在後1秒（13:47:16）到達最高點。

13:47:13-13:47:15究竟發生了什麼？尤其是在13:47:15。。。

再來看另外一次波動情況：

竟然在IIS日誌中沒找到對應的記錄，這種情況很讓人懷疑是TCP連線被偷偷斷掉，也是就是昨天的猜想2。

這篇博文先簡單分享一下今天的進展，接下來我們還要進行更多的分析與排查，阿里雲的同學也在努力排查問題，希望早日找到問題的原因並從根本上解決。

相關文章

雲端計算之路-阿里雲上：藉助IIS Log Parser Studio分析“黑色30秒”問題
2014-04-25
阿里
雲端計算之路-阿里雲上：對“黑色30秒”問題的猜想
2014-04-24
阿里
雲端計算之路-阿里雲上：Web伺服器遭遇奇怪的“黑色30秒”問題
2014-04-22
阿里Web伺服器
雲端計算之路-阿里雲上：“黑色30秒”走了，“黑色1秒”來了，真相也許大白了
2014-05-08
阿里
雲端計算之路-阿里雲上：排查“黑色30秒”問題-為什麼請求會排隊
2014-04-23
阿里
雲端計算之路-阿里雲上：從ASP.NET執行緒角度對“黑色30秒”問題的全新分析
2014-04-28
阿里ASP.NET執行緒
雲端計算之路-阿里雲上：神奇的“黑色30秒”再次出現，究竟是誰的錯？
2014-05-05
阿里
雲端計算與虛擬化結合技術分析
2015-01-09
雲端計算秒殺電商秒殺
2014-07-25
雲端計算40個問題
2019-03-22
雲端計算的安全問題
2017-01-14
日誌易：IT運維分析及海量日誌搜尋的實踐之路（上）
2017-05-27
運維
一眼定位問題，函式計算釋出日誌關鍵詞秒檢索功能
2022-03-16
函式
一眼定位問題，函式計算髮布日誌關鍵詞秒檢索功能
2022-03-23
函式
用Log Parser Studio分析IIS日誌
2014-04-25
雲端計算論文讀後感【3】- 雲端計算的問題
2009-04-28
解讀：從全球雲端計算到阿里雲端計算
2014-03-03
阿里
誰在用阿里雲?雲端計算使用者須知10個問題
2014-08-29
阿里
websphere日誌分析——程式隱患問題
2010-03-03
Web
阿里雲日誌服務問題反饋流程
2016-10-28
阿里
技術革命——雲端計算結合人工智慧
2023-10-08
人工智慧
雲端計算面試常見問題：Linux目錄結構
2019-07-10
面試Linux
雲端計算面試題及答案，AWS雲端計算面試題
2019-06-19
面試題
IIS配置問題總結
2011-12-29
開闢通向雲端計算之路薦
2009-08-10
OpenStack及雲端計算（面試）常見問題
2020-07-18
面試
雲端計算潛在的五個問題
2014-08-05
雲端計算的安全問題是“偽命題”嗎？
2011-07-15
AI之旅-開篇：從雲端計算之路到AI之旅，從搬上阿里雲到留在阿里雲
2024-10-27
AI阿里
雲端計算面試題及答案，雲端計算崗位精品面試題
2019-06-18
面試題
好程式設計師雲端計算教程分享Linux雲端計算面試常見問題一
2019-11-11
程式設計師Linux面試
好程式設計師雲端計算教程分享Linux雲端計算面試常見問題二
2019-11-12
程式設計師Linux面試
好程式設計師雲端計算教程分享Linux雲端計算面試常見問題三
2019-11-12
程式設計師Linux面試
什麼是雲端計算?雲端計算適合哪些人學習?
2020-09-17
guava cache大量的WARN日誌的問題分析
2019-07-10
Guava
Linux雲端計算面試題第二彈，樂視雲端計算面試題
2019-05-20
Linux面試題
萬網域名阿里雲端計算產業鏈上的關鍵一環
2017-10-02
阿里產業
阿里雲函式計算域名配置問題
2024-04-04
阿里函式