vmstat檢視分析Linux系統負載效能

大雄45發表於2022-05-02
導讀 vmstat 是用來獲得有關程式、記憶體、頁面交換空間及 CPU活動的資訊。這些資訊反映了系統的負載情況。
一、簡介

vmstat : 用來獲得有關程式、記憶體、頁面交換空間及 CPU活動的資訊。這些資訊反映了系統的負載情況。

vmstat檢視分析Linux系統負載效能vmstat檢視分析Linux系統負載效能

Desk cluttered with business documents

二、使用vmstat

引數用法

vmstat [-a] [-n] [-S unit] [delay [ count]]
vmstat [-s] [-n] [-S unit]
vmstat [-m] [-n] [delay [ count]]
vmstat [-d] [-n] [delay [ count]]
vmstat [-p disk partition] [-n] [delay [ count]]
vmstat [-f]
vmstat [-V]
-a:顯示活躍和非活躍記憶體
-f:顯示從系統啟動至今的fork數量 。
-m:顯示slabinfo
-n:只在開始時顯示一次各欄位名稱。
-s:顯示記憶體相關統計資訊及多種系統活動數量。
delay:重新整理時間間隔。如果不指定,只顯示一條結果。
count:重新整理次數。如果不指定重新整理次數,但指定了重新整理時間間隔,這時重新整理次數為無窮。
-d:顯示磁碟相關統計資訊。
-p:顯示指定磁碟分割槽統計資訊
-S:使用指定單位顯示。引數有 k 、K 、m 、M ,分別代表1000、1024、1000000、1048576位元組(byte)。預設單位為K(1024 bytes)
-V:顯示vmstat版本資訊。
三、vmstat資訊檢視

常用命令如下:

vmstat 1 10

1表示每隔1秒採集一次伺服器狀態,10表示只採集10次。

vmstat檢視分析Linux系統負載效能vmstat檢視分析Linux系統負載效能

Procs(程式):

r:執行佇列中程式數量,這個值也可以判斷是否需要增加CPU。(長期大於1),當這個值超過了CPU數目,就會出現CPU瓶頸了。這個也和top的負載有關係,一般負載超過了3就比較高,超過了5就高,超過了10就不正常了,伺服器的狀態很危險。
b:等待IO的程式數量,及阻塞的程式。

Memory(記憶體):

swpd:使用虛擬記憶體大小,如果大於0,表示你的機器實體記憶體不足了,如果不是程式記憶體洩露的原因,那麼你該升級記憶體了或者把耗記憶體的任務遷移到其他機器。
注意:如果swpd的值不為0,但是SI,SO的值長期為0,這種情況不會影響系統效能。

free:空閒實體記憶體大小
buff:用作緩衝的記憶體大小,inux/Unix系統是用來儲存,目錄裡面有什麼內容,許可權等的快取
cache:用作快取的記憶體大小 (這裡是 /Unix的聰明之處,把空閒的實體記憶體的一部分拿來做檔案和目錄的快取,是為了提高 程式執行的效能,當程式使用記憶體時,buffer/cached會很快地被使用。)
注意:如果cache的值大的時候,說明cache處的檔案數多,如果頻繁訪問到的檔案都能被cache處,那麼磁碟的讀IO bi會非常小。

Swap:

si:每秒從交換區寫到記憶體的大小,由磁碟調入記憶體,如果這個值大於0,表示實體記憶體不夠用或者記憶體洩露了,要查詢耗記憶體程式解決掉。
so:每秒寫入交換區的記憶體大小,由記憶體調入磁碟,如果這個值大於0,同上。
注意:記憶體夠用的時候,這2個值都是0,如果這2個值長期大於0時,系統效能會受到影響,磁碟IO和CPU資源都會被消耗。有些朋友看到空閒記憶體(free)很少的或接近於0時,就認為記憶體不夠用了,不能光看這一點,還要結合si和so,如果free很少,但是si和so也很少(大多時候是0),那麼不用擔心,系統效能這時不會受到影響的。

IO:(現在的Linux版本塊的大小為1kb)

bi:每秒讀取的塊數,塊裝置每秒接收的塊數量,這裡的塊裝置是指系統上所有的磁碟和其他塊裝置,預設塊大小是1024byte。
bo:每秒寫入的塊數,塊裝置每秒傳送的塊數量,例如我們讀取檔案,bo就要大於0。bi和bo一般都要接近0,不然就是IO過於頻繁,需要調整。
注意:隨機磁碟讀寫的時候,這2個值越大(如超出1024k),能看到CPU在IO等待的值也會越大。

系統:

in:每秒中斷數,包括時鐘中斷。
cs:每秒上下文切換數。每秒上下文切換次數,例如我們呼叫系統函式,就要進行上下文切換,執行緒的切換,也要進行上下文切換,這個值要越小越好,太大了,要考慮調低執行緒或者程式的數目,例如在apache和nginx這種web伺服器中,我們一般做效能測試時會進行幾千併發甚至幾萬併發的測試,選擇web伺服器的程式可以由程式或者執行緒的峰值一直下調,壓測,直到cs到一個比較小的值,這個程式和執行緒數就是比較合適的值了。系統呼叫也是,每次呼叫系統函式,我們的程式碼就會進入核心空間,導致上下文切換,這個是很耗資源的,也要儘量避免頻繁呼叫系統函式。上下文切換次數過多表示你的CPU大部分浪費在上下文切換,導致CPU幹正經事的時間少了,CPU沒有充分利用,是不可取的。
注意:上面2個值越大,會看到由核心消耗的CPU時間會越大。

CPU(以百分比表示):

us:使用者程式執行時間百分比(user time)
注意: us的值比較高時,說明使用者程式消耗的CPU時間多,但是如果長期超50%的使用,那麼我們就該考慮最佳化程式演算法或者進行加速。

sy:核心系統程式執行時間百分比(system time), 系統CPU時間,如果太高,表示系統呼叫時間長,例如是IO操作頻繁
注意:sy的值高時,說明系統核心消耗的CPU資源多,這並不是良性表現,我們應該檢查原因。

wa:IO等待時間百分比,等待IO時間,wa的值高時,說明IO等待比較嚴重,這可能由於磁碟大量作隨機訪問造成,也有可能磁碟出現瓶頸。
注意:wa的值高時,說明IO等待比較嚴重,這可能由於磁碟大量作隨機訪問造成,也有可能磁碟出現瓶頸(塊操作)。

id:空閒時間百分比,空閒 CPU時間,一般來說,id + us + sy = 100,一般我認為id是空閒CPU使用率,us是使用者CPU使用率,sy是系統CPU使用率
wt:等待IO CPU時間。

原文來自:

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69955379/viewspace-2889589/,如需轉載,請註明出處,否則將追究法律責任。

相關文章