Windows 2003自帶效能監控工具的使用

Davis_itpub發表於2018-06-27
前幾天有一臺備庫在累積了多日的REDO後,進行REDO APPLY時,整個系統變得異常緩慢,透過Windows 2003效能監控工具發現是硬碟IO出現瓶頸。下面列出收集的Windows 2003自帶效能監控工具的指標說明。
工具的執行方式:管理 -> 效能
相關效能指標:
1) Memory -> Page Reads/sec過高,持續大於5。
過多的頁交換要使用大量的硬碟空間,很容易將導致將頁交換記憶體不足與導致頁交換的磁碟瓶徑混淆。這就需要我們在研究記憶體不足不太明顯的頁交換的原因時,必須跟蹤如下的磁碟使用情況計數器和記憶體計數器:
Physical Disk -> % Disk Time
Physical Disk -> Avg.Disk Queue Length
Memory -> Page Reads/sec
含義:
Page Reads/sec 是讀取磁碟以解析硬頁面錯誤的次數。它顯示讀取操作的數量,它並不考慮每個操作的頁面數量。當一個程式引用一個虛擬記憶體的頁面,而此虛擬記憶體位於工作集以外或實體記憶體的其他位置,並且此頁面必須從磁碟檢索時,就會發生硬頁面錯誤。此計數器是引起系統範圍內延遲的主要指示器。它包含讀取操作以滿足檔案系統快取(通常由應用程式請求)和非快取對映記憶體檔案的錯誤。比較記憶體的值 與記憶體的值 來決定每個操作取讀的平均頁面數量。
通俗含義:
頁的硬故障,Page/sec的子集,是為了解決硬錯誤,從硬碟讀取的次數。
分析:
閾值為>5,越低越好。大數值表示磁碟讀而不是快取讀。持續大於5的值,表明記憶體的讀請求發生了較多的缺頁中斷(page fault)。
說明程式的Working Set已經不夠,使用硬碟來虛擬記憶體。此處為讀得次數,不關心讀取得頁數,比較大的值表明記憶體出現了瓶頸。
a) 如果Memory -> Page Reads/sec比較低,但Physical Disk -> % Disk Time 和 Physical Disk -> Avg. Disk Queue Length計數器很高,表明磁碟有瓶頸。
b) 如果隨著Physical Disk -> Avg. Disk Queue Length的增加,而Memory -> Page Reads/sec並沒有減少,表明有記憶體的瓶頸。
2) 硬碟的相關效能指標
Avg.Disk sec/Transfer計數器反映磁碟完成請求所用的時間。較高的值表明磁碟控制器由於失敗而不斷重試該磁碟。這些故障會增加平均磁碟傳送時間。對於大多數磁碟,較高的磁碟平均傳送時間是大於 0.3 秒。
Avg.Disk Bytes/Transfer值大於 20 KB 表示該磁碟驅動器通常執行良好;如果應用程式正在訪問磁碟,則會產生較低的值。例如,隨機訪問磁碟的應用程式會增加平均 Disk sec/Transfer 時間,因為隨機傳送需要增加搜尋時間。
Disk Transfer/sec一般來說,定義該值小於15ms最為優異,介於15-30ms之間為良好,30-60ms之間為可以接受,超過60ms則需要考慮更換硬碟或硬碟的RAID方式了。
如果以下幾個計數器之一的值有大於20毫秒的話,磁碟就是超負荷了:Avg.Disk sec/Read,avg.Disk sec / Write,Avg.Disk sec/Transfer。
如果在Physical Disk 計數器中,只有%Disk Time 比較大,其他值都比較適中,硬碟可能會是瓶頸。若幾個值都比較大,且數值持續超過80%,則可能是記憶體洩漏。
3) 決定工作負載的平衡
要平衡網路伺服器上的負載,需要了解伺服器磁碟驅動器的繁忙程度。使用 Physical Disk -> % Disk Time 計數器,該計數器顯示驅動器活動時間的百分比。如果 % Disk Time 較高(超過 90%),請檢查 Physical Disk -> Current Disk Queue Length 計數器以檢視正在等待磁碟訪問的系統請求數量。等待 I/O 請求的數量應當保持在不大於組成物理磁碟的主軸數的 1.5 到 2 倍。大多數磁碟只有一個軸,但獨立磁碟冗餘陣列 (RAID) 裝置通常有多個軸。硬體 RAID 裝置在系統監視器中顯示為一個物理磁碟。透過軟體建立的多個 RAID 裝置在系統監視器中顯示為多個例項。
可以使用 Current Disk Queue Length 和 % Disk Time 計數器的值檢測磁碟子系統中的瓶頸。如果 Current Disk Queue Length 和 % Disk Time 計數器的值一直很高,則考慮下列事項:
   使用速度更快的磁碟驅動器。
   將某些檔案移至其他磁碟或伺服器。
   如果正在使用一個 RAID 陣列,則在該陣列中新增磁碟。
如果使用 RAID 裝置,% Disk Time 計數器會指示大於 100% 的值(出現這種現象的原因是處理器允許作業系統使用重疊的I/O,磁碟效能計數器使用一個100納秒精度的計數器來度量磁碟時間,再按照取樣頻率顯示出來。取樣後的時間可能會超過100%,比如:在2毫秒內有10個請求,取樣時間為10毫秒。如果是raid磁碟,因為作業系統可以讀寫到多到磁碟上,從而產生重疊 I/O,這會使%disk time大於100%。)。如果出現這種情況,則使用 PhysicalDisk: Avg.Disk Queue Length 計數器來確定等待進行磁碟訪問的平均系統請求數量。
I/O 依賴的應用程式或系統可能會使磁碟持續處於活動狀態。
監視 Memory: Page Faults/sec 計數器可以確保磁碟活動不是由分頁導致的。在 Windows 中,換頁的原因包括:
   配置程式佔用了過多記憶體。
   檔案系統活動。
如果在同一硬碟上有多個邏輯分割槽,請使用 Logical Disk 計數器而非 Physical Disk 計數器。檢視邏輯磁碟計數器有助於確定哪些檔案被頻繁訪問。當發現磁碟有大量讀/寫活動時,請檢視讀寫專用計數器以確定導致每個邏輯卷負荷增加的磁碟活動型別,例如,Logical Disk: Disk Write Bytes/sec。
使用技巧:
1)可以開啟日誌跟蹤的功能,將各引數的變化情況記錄到日誌檔案,供以後分析。
2)如果開啟的指標太多,看不清楚,可以自定義計數器增加計數指標;線條的顏色、比率、粗細等,以從中分辨出自己最關注的曲線。
 

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31520497/viewspace-2156882/,如需轉載,請註明出處,否則將追究法律責任。

相關文章