導讀	vmstat 是用來獲得有關程式、記憶體、頁面交換空間及 CPU活動的資訊。這些資訊反映了系統的負載情況。

一、簡介

vmstat ：用來獲得有關程式、記憶體、頁面交換空間及 CPU活動的資訊。這些資訊反映了系統的負載情況。

vmstat檢視分析Linux系統負載效能vmstat檢視分析Linux系統負載效能

Desk cluttered with business documents

二、使用vmstat

引數用法

vmstat [-a] [-n] [-S unit] [delay [ count]]
vmstat [-s] [-n] [-S unit]
vmstat [-m] [-n] [delay [ count]]
vmstat [-d] [-n] [delay [ count]]
vmstat [-p disk partition] [-n] [delay [ count]]
vmstat [-f]
vmstat [-V]
-a：顯示活躍和非活躍記憶體
-f：顯示從系統啟動至今的fork數量 。
-m：顯示slabinfo
-n：只在開始時顯示一次各欄位名稱。
-s：顯示記憶體相關統計資訊及多種系統活動數量。
delay：重新整理時間間隔。如果不指定，只顯示一條結果。
count：重新整理次數。如果不指定重新整理次數，但指定了重新整理時間間隔，這時重新整理次數為無窮。
-d：顯示磁碟相關統計資訊。
-p：顯示指定磁碟分割槽統計資訊
-S：使用指定單位顯示。引數有 k 、K 、m 、M ，分別代表1000、1024、1000000、1048576位元組（byte）。預設單位為K（1024 bytes）
-V：顯示vmstat版本資訊。

三、vmstat資訊檢視

常用命令如下：

vmstat 1 10

1表示每隔1秒採集一次伺服器狀態，10表示只採集10次。

Procs(程式)：

r：執行佇列中程式數量，這個值也可以判斷是否需要增加CPU。(長期大於1)，當這個值超過了CPU數目，就會出現CPU瓶頸了。這個也和top的負載有關係，一般負載超過了3就比較高，超過了5就高，超過了10就不正常了，伺服器的狀態很危險。
b：等待IO的程式數量，及阻塞的程式。

Memory(記憶體)：

swpd：使用虛擬記憶體大小，如果大於0，表示你的機器實體記憶體不足了，如果不是程式記憶體洩露的原因，那麼你該升級記憶體了或者把耗記憶體的任務遷移到其他機器。
注意：如果swpd的值不為0，但是SI，SO的值長期為0，這種情況不會影響系統效能。

free：空閒實體記憶體大小
buff：用作緩衝的記憶體大小，inux/Unix系統是用來儲存，目錄裡面有什麼內容，許可權等的快取
cache：用作快取的記憶體大小 (這裡是 /Unix的聰明之處，把空閒的實體記憶體的一部分拿來做檔案和目錄的快取，是為了提高程式執行的效能，當程式使用記憶體時，buffer/cached會很快地被使用。)
注意：如果cache的值大的時候，說明cache處的檔案數多，如果頻繁訪問到的檔案都能被cache處，那麼磁碟的讀IO bi會非常小。

Swap：

si：每秒從交換區寫到記憶體的大小，由磁碟調入記憶體，如果這個值大於0，表示實體記憶體不夠用或者記憶體洩露了，要查詢耗記憶體程式解決掉。
so：每秒寫入交換區的記憶體大小，由記憶體調入磁碟，如果這個值大於0，同上。
注意：記憶體夠用的時候，這2個值都是0，如果這2個值長期大於0時，系統效能會受到影響，磁碟IO和CPU資源都會被消耗。有些朋友看到空閒記憶體(free)很少的或接近於0時，就認為記憶體不夠用了，不能光看這一點，還要結合si和so，如果free很少，但是si和so也很少(大多時候是0)，那麼不用擔心，系統效能這時不會受到影響的。

IO：(現在的Linux版本塊的大小為1kb)

bi：每秒讀取的塊數，塊裝置每秒接收的塊數量，這裡的塊裝置是指系統上所有的磁碟和其他塊裝置，預設塊大小是1024byte。
bo：每秒寫入的塊數，塊裝置每秒傳送的塊數量，例如我們讀取檔案，bo就要大於0。bi和bo一般都要接近0，不然就是IO過於頻繁，需要調整。
注意：隨機磁碟讀寫的時候，這2個值越大(如超出1024k)，能看到CPU在IO等待的值也會越大。

系統：

in：每秒中斷數，包括時鐘中斷。
cs：每秒上下文切換數。每秒上下文切換次數，例如我們呼叫系統函式，就要進行上下文切換，執行緒的切換，也要進行上下文切換，這個值要越小越好，太大了，要考慮調低執行緒或者程式的數目,例如在apache和nginx這種web伺服器中，我們一般做效能測試時會進行幾千併發甚至幾萬併發的測試，選擇web伺服器的程式可以由程式或者執行緒的峰值一直下調，壓測，直到cs到一個比較小的值，這個程式和執行緒數就是比較合適的值了。系統呼叫也是，每次呼叫系統函式，我們的程式碼就會進入核心空間，導致上下文切換，這個是很耗資源的，也要儘量避免頻繁呼叫系統函式。上下文切換次數過多表示你的CPU大部分浪費在上下文切換，導致CPU幹正經事的時間少了，CPU沒有充分利用，是不可取的。
注意：上面2個值越大，會看到由核心消耗的CPU時間會越大。

CPU(以百分比表示)：

us：使用者程式執行時間百分比(user time)
注意： us的值比較高時，說明使用者程式消耗的CPU時間多，但是如果長期超50%的使用，那麼我們就該考慮優化程式演算法或者進行加速。

sy：核心系統程式執行時間百分比(system time)，系統CPU時間，如果太高，表示系統呼叫時間長，例如是IO操作頻繁
注意：sy的值高時，說明系統核心消耗的CPU資源多，這並不是良性表現，我們應該檢查原因。

wa：IO等待時間百分比，等待IO時間，wa的值高時，說明IO等待比較嚴重，這可能由於磁碟大量作隨機訪問造成，也有可能磁碟出現瓶頸。
注意：wa的值高時，說明IO等待比較嚴重，這可能由於磁碟大量作隨機訪問造成，也有可能磁碟出現瓶頸(塊操作)。

id：空閒時間百分比，空閒 CPU時間，一般來說，id + us + sy = 100,一般我認為id是空閒CPU使用率，us是使用者CPU使用率，sy是系統CPU使用率
wt：等待IO CPU時間。

原文來自：

vmstat檢視分析Linux系統負載效能

相關文章