常用系統命令介紹

yobyin發表於2012-12-17
TOP是一個動態顯示過程,即可以透過使用者按鍵來不斷重新整理當前狀態.如果在前臺執行該命令,它將獨佔前臺,直到使用者終止該程式為止.比較準確的說,top命令提供了實時的對系統處理器的狀態監視.它將顯示系統中CPU最“敏感”的任務列表.該命令可以按CPU使用.記憶體使用和執行時間對任務進行排序;而且該命令的很多特性都可以透過互動式命令或者在個人定製檔案中進行設定.
top - 12:38:33 up 50 days, 23:15,  7 users,  load average: 60.58, 61.14, 61.22
Tasks: 203 total,  60 running, 139 sleeping,   4 stopped,   0 zombie
Cpu(s)  : 27.0%us, 73.0%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Mem:   1939780k total,  1375280k used,   564500k free,   109680k buffers
Swap:  4401800k total,   497456k used,  3904344k free,   848712k cached
PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND                               
 4338 oracle    25   0  627m 209m 207m R    0 11.0 297:14.76 oracle                               
 4267 oracle    25   0  626m 144m 143m R    6  7.6  89:16.62 oracle                               
 3458 oracle    25   0  672m 133m 124m R    0  7.1   1283:08 oracle                               
 3478 oracle    25   0  672m 124m 115m R    0  6.6   1272:30 oracle                               
 3395 oracle    25   0  672m 122m 113m R    0  6.5   1270:03 oracle                                
 3480 oracle    25   0  672m 122m 109m R    8  6.4   1274:13 oracle                               
 3399 oracle    25   0  672m 121m 110m R    0  6.4   1279:37 oracle                               
 4261 oracle    25   0  634m 100m  99m R    0  5.3  86:13.90 oracle                               
25737 oracle    25   0  632m  81m  74m R    0  4.3 272:35.42 oracle                               
 7072 oracle    25   0  626m  72m  71m R    0  3.8   6:35.68 oracle                               
16073 oracle    25   0  630m  68m  63m R    8  3.6 175:20.36 oracle                               
16140 oracle    25   0  630m  66m  60m R    0  3.5 175:13.42 oracle                               
16122 oracle    25   0  630m  66m  60m R    0  3.5 176:47.73 oracle                               
  786 oracle    25   0  627m  63m  63m R    0  3.4   1:54.93 oracle                               
 4271 oracle    25   0  627m  59m  58m R    8  3.1  86:09.64 oracle                               
 4273 oracle    25   0  627m  57m  56m R    8  3.0  84:38.20 oracle                               
22670 oracle    25   0  626m  50m  49m R    0  2.7  84:55.82 oracle    
一.  TOP前五行統計資訊
統計資訊區前五行是系統整體的統計資訊。
1. 第一行是任務佇列資訊
同 uptime  命令的執行結果:
[root@localhost ~]# uptime
 13:22:30 up 8 min,  4 users,  load average: 0.14, 0.38, 0.25
其內容如下:
12:38:33
 當前時間
 
up 50days
 系統執行時間,格式為時:分
 
1 user
 當前登入使用者數
 
load average: 0.06, 0.60, 0.48
 系統負載,即任務佇列的平均長度。 三個數值分別為  1分鐘、5分鐘、15分鐘前到現在的平均值。
 
2. 第二、三行為程式和CPU的資訊
當有多個CPU時,這些內容可能會超過兩行。內容如下:
Tasks: 29 total
 程式總數
 
1 running
 正在執行的程式數
 
28 sleeping
 睡眠的程式數
 
0 stopped
 停止的程式數
 
0 zombie
 殭屍程式數
 
Cpu(s): 0.3% us
 使用者空間佔用CPU百分比
 
1.0% sy
 核心空間佔用CPU百分比
 
0.0% ni
 使用者程式空間內改變過優先順序的程式佔用CPU百分比
 
98.7% id
 空閒CPU百分比
 
0.0% wa
 等待輸入輸出的CPU時間百分比
 
0.0% hi
 
0.0% si
 
3. 第四五行為記憶體資訊。
內容如下:
Mem: 191272k total
 實體記憶體總量
 
173656k used
 使用的實體記憶體總量
 
17616k free
 空閒記憶體總量
 
22052k buffers
 用作核心快取的記憶體量
 
Swap: 192772k total
 交換區總量
 
0k used
 使用的交換區總量
 
192772k free
 空閒交換區總量
 
123988k cached
 緩衝的交換區總量。 記憶體中的內容被換出到交換區,而後又被換入到記憶體,但使用過的交換區尚未被覆蓋, 該數值即為這些內容已存在於記憶體中的交換區的大小。相應的記憶體再次被換出時可不必再對交換區寫入。
 
二.  程式資訊
列名
 含義
 
PID
 程式id
 
PPID
 父程式id
 
RUSER
 Real user name
 
UID
 程式所有者的使用者id
 
USER
 程式所有者的使用者名稱
 
GROUP
 程式所有者的組名
 
TTY
 啟動程式的終端名。不是從終端啟動的程式則顯示為 ?
 
PR
 優先順序
 
NI
 nice值。負值表示高優先順序,正值表示低優先順序
 
P
 最後使用的CPU,僅在多CPU環境下有意義
 
%CPU
 上次更新到現在的CPU時間佔用百分比
 
TIME
 程式使用的CPU時間總計,單位秒
 
TIME+
 程式使用的CPU時間總計,單位1/100秒
 
%MEM
 程式使用的實體記憶體百分比
 
VIRT
 程式使用的虛擬記憶體總量,單位kb。VIRT=SWAP+RES
 
SWAP
 程式使用的虛擬記憶體中,被換出的大小,單位kb。
 
RES
 程式使用的、未被換出的實體記憶體大小,單位kb。RES=CODE+DATA
 
CODE
 可執行程式碼佔用的實體記憶體大小,單位kb
 
DATA
 可執行程式碼以外的部分(資料段+棧)佔用的實體記憶體大小,單位kb
 
SHR
 共享記憶體大小,單位kb
 
nFLT
 頁面錯誤次數
 
nDRT
 最後一次寫入到現在,被修改過的頁面數。
 
S
 程式狀態。
            D=不可中斷的睡眠狀態
            R=執行
            S=睡眠
            T=跟蹤/停止
            Z=殭屍程式
 
COMMAND
 命令名/命令列
 
WCHAN
 若該程式在睡眠,則顯示睡眠中的系統函式名
 
Flags
 任務標誌,參考 sched.h
 
top 的man 命令解釋如下:
    Listed below are top's available fields.  They are always associated with the  letter  shown,  regardless  of the position you may have established for them with the 'o' (Order fields) interactive command.Any field is selectable as the sort field, and you control whether they are  sorted high-to-low  or  low-to-high.   For  additional  information on sort provisions see  topic 3c. TASK Area Commands.
a: PID  --  Process Id
       The task's unique process ID, which periodically wraps, though never  restarting at zero.
b: PPID  --  Parent Process Pid
       The process ID of a task's parent.
c: RUSER  --  Real User Name
       The real user name of the task's owner.
d: UID  --  User Id
       The effective user ID of the task's owner.
e: USER  --  User Name
       The effective user name of the task's owner.
f: GROUP  --  Group Name
       The effective group name of the task's owner.
g: TTY  --  Controlling Tty
       The  name of the controlling terminal.  This is usually the device (serial port, pty, etc.) from which the process was started, and which it uses  for  input  oroutput.   However,  a task need not be associated with a terminal, in which case you'll see '?' displayed.
h: PR  --  Priority
       The priority of the task.
i: NI  --  Nice value
       The nice value of the task.   A  negative  nice  value  means  higher  priority, whereas  a  positive nice value means lower priority.  Zero in this field simply means priority will not be adjusted in determining a task's dispatchability.
j: P  --  Last used CPU (SMP)
       A number representing the last used processor.  In a true SMP  environment  this will likely change frequently since the kernel intentionally uses weak affinity. Also, the very act of running top may break this weak affinity  and  cause  more processes  to change CPUs more often (because of the extra demand for cpu time).
k: %CPU  --  CPU usage
       The task's share of the elapsed CPU time since the last screen update, expressed as a percentage of total CPU time.  In a true SMP environment, if 'Irix mode' is Off, top will operate in 'Solaris mode' where a task's cpu usage will be divided by  the  total  number  of  CPUs.   You toggle 'Irix/Solaris' modes with the 'I' interactive command.
l: TIME  --  CPU Time
       Total CPU time the task has used since it started.  When  'Cumulative  mode'  is On,  each  process is listed with the cpu time that it and its dead children has used.  You toggle 'Cumulative mode' with 'S', which is a command-line option and an interactive command.  See the 'S' interactive command for additional information regarding this mode.
m: TIME+  --  CPU Time, hundredths
       The same as 'TIME', but reflecting more granularity through hundredths of a sec          ond.
n: %MEM  --  Memory usage (RES)
       A task's currently used share of available physical memory.
o: VIRT  --  Virtual Image (kb)
       The total amount of virtual memory used by the task.  It includes all code, data and shared libraries plus pages that have  been  swapped  out.  (Note:  you  can define  the STATSIZE=1 environment variable and the VIRT will be calculated from the /proc/#/state VmSize field.)
       VIRT = SWAP + RES.
p: SWAP  --  Swapped size (kb)
       The swapped out portion of a task's total virtual memory image.
q: RES  --  Resident size (kb)
       The non-swapped physical memory a task has used.
       RES = CODE + DATA.
r: CODE  --  Code size (kb)
       The amount of physical memory devoted to executable  code,  also  known  as  the'text resident set' size or TRS.
s: DATA  --  Data+Stack size (kb)
       The  amount of physical memory devoted to other than executable code, also known the 'data resident set' size or DRS.
t: SHR  --  Shared Mem size (kb)
       The amount of shared memory used by a task.   It  simply  reflects  memory  that could be potentially shared with other processes.
u: nFLT  --  Page Fault count
       The  number  of  major  page faults that have occurred for a task.  A page fault occurs when a process attempts to read from or write to a virtual page  that  is not  currently  present  in  its address space.  A major page fault is when disk access is involved in making that page available.
v: nDRT  --  Dirty Pages count
       The number of pages that have been modified since  they  were  last  written  to disk.   Dirty  pages  must  be written to disk before the corresponding physical memory location can be used for some other virtual page.
w: S  --  Process Status
       The status of the task which can be one of:
             'D' = uninterruptible sleep
             'R' = running
             'S' = sleeping
             'T' = traced or stopped
             'Z' = zombie
       Tasks shown as running should be more properly thought of as 'ready to run'  --their  task_struct is simply represented on the Linux run-queue.  Even without a true SMP machine, you may see numerous tasks in this state  depending  on  top's delay interval and nice value.
x: Command  --  Command line or Program name
       Display the command line used to start a task or the name of the associated program.  You toggle between command line and name with 'c', which is both  a  command-line option and an interactive command. When  you've  chosen  to display command lines, processes without a command line (like kernel threads) will be shown with only the program name  in  parentheses, as in this example:                ( mdrecoveryd ) Either  form  of  display is subject to potential truncation if it's too long to fit in this field's  current  width.   That  width  depends  upon  other  fields  selected, their order and the current screen width.
       Note: The 'Command' field/column is unique, in that it is not fixed-width.  When displayed, this column will be allocated all remaining screen width (up  to  the maximum  512  characters)  to  provide for the potential growth of program names into command lines.
y: WCHAN  --  Sleeping in Function
       Depending on the availability of the kernel link map ('System.map'), this  field will  show  the  name or the address of the kernel function in which the task is currently sleeping.  Running tasks will display a dash ('-') in this column.
       Note: By displaying this field, top's own working set will be increased by  over 700Kb.   Your  only  means of reducing that overhead will be to stop and restart          top.
z: Flags  --  Task Flags
       This column represents the task's current scheduling flags which  are  expressed in  hexadecimal  notation and with zeros suppressed.  These flags are officially documented in .  Less formal documentation can also be  found  on the 'Fields select' and 'Order fields' screens.
       預設情況下僅顯示比較重要的  PID、USER、PR、NI、VIRT、RES、SHR、S、%CPU、%MEM、TIME+、COMMAND  列。
2.1 用快捷鍵更改顯示內容。
(1)更改顯示內容透過 f鍵可以選擇顯示的內容。
       按 f 鍵之後會顯示列的列表,按 a-z  即可顯示或隱藏對應的列,最後按Enter鍵確定。
(2)按o鍵可以改變列的顯示順序。
       按小寫的 a-z 可以將相應的列向右移動,而大寫的 A-Z  可以將相應的列向左移動。最後按Enter鍵確定。
       按大寫的 F 或 O 鍵,然後按 a-z 可以將程式按照相應的列進行排序。而大寫的  R 鍵可以將當前的排序倒轉。
       設定完按回車返回介面。
三.  命令使用
詳細內容可以參考MAN 幫助文件。這裡列舉部分內容:
命令格式:
top [-] [d] [p] [q] [c] [C] [S]    [n]
引數說明:
d:  指定每兩次螢幕資訊重新整理之間的時間間隔。當然使用者可以使用s互動命令來改變之。
p:  透過指定監控程式ID來僅僅監控某個程式的狀態。
q:該選項將使top沒有任何延遲的進行重新整理。如果呼叫程式有超級使用者許可權,那麼top將以儘可能高的優先順序執行。
S: 指定累計模式
s : 使top命令在安全模式中執行。這將去除互動命令所帶來的潛在危險。
i:  使top不顯示任何閒置或者僵死程式。
c:  顯示整個命令列而不只是顯示命令名
在top命令的顯示視窗,我們還可以輸入以下字母,進行一些互動:
幫助文件如下:
Help for Interactive Commands - procps version 3.2.7
Window 1:Def: Cumulative mode Off.  System: Delay 4.0 secs; Secure mode Off.
  Z,B       Global: 'Z' change color mappings; 'B' disable/enable bold
  l,t,m     Toggle Summaries: 'l' load avg; 't' task/cpu stats; 'm' mem info
  1,I       Toggle SMP view: '1' single/separate states; 'I' Irix/Solaris mode
  f,o     . Fields/Columns: 'f' add or remove; 'o' change display order
  F or O  . Select sort field
       . Move sort field: '' next col right
  R,H     . Toggle: 'R' normal/reverse sort; 'H' show threads
  c,i,S   . Toggle: 'c' cmd name/line; 'i' idle tasks; 'S' cumulative time
  x,y     . Toggle highlights: 'x' sort field; 'y' running tasks
  z,b     . Toggle: 'z' color/mono; 'b' bold/reverse (only if 'x' or 'y')
  u       . Show specific user only
  n or #  . Set maximum tasks displayed
  k,r       Manipulate tasks: 'k' kill; 'r' renice
  d or s    Set update interval
  W         Write configuration file
  q         Quit
          ( commands shown with '.' require a visible task display window )
Press 'h' or '?' for help with Windows,
h或者?  : 顯示幫助畫面,給出一些簡短的命令總結說明。
k  :終止一個程式。系統將提示使用者輸入需要終止的程式PID,以及需要傳送給該程式什麼樣的訊號。一般的終止程式可以使用15訊號;如果不能正常結束那就使用訊號9強制結束該程式。預設值是訊號15。在安全模式中此命令被遮蔽。
i:忽略閒置和僵死程式。這是一個開關式命令。
q:  退出程式。
r:  重新安排一個程式的優先順序別。系統提示使用者輸入需要改變的程式PID以及需要設定的程式優先順序值。輸入一個正值將使優先順序降低,反之則可以使該程式擁有更高的優先權。預設值是10。
S:切換到累計模式。
s :  改變兩次重新整理之間的延遲時間。系統將提示使用者輸入新的時間,單位為s。如果有小數,就換算成ms。輸入0值則系統將不斷重新整理,預設值是5 s。需要注意的是如果設定太小的時間,很可能會引起不斷重新整理,從而根本來不及看清顯示的情況,而且系統負載也會大大增加。
f或者F :從當前顯示中新增或者刪除專案。
o或者O  :改變顯示專案的順序。
l: 切換顯示平均負載和啟動時間資訊。即顯示影藏第一行
m: 切換顯示記憶體資訊。即顯示影藏記憶體行
t : 切換顯示程式和CPU狀態資訊。即顯示影藏CPU行
c:  切換顯示命令名稱和完整命令列。 顯示完整的命令。 這個功能很有用。
M : 根據駐留記憶體大小進行排序。
P:根據CPU使用百分比大小進行排序。
T: 根據時間/累計時間進行排序。
W:  將當前設定寫入~/.toprc檔案中。這是寫top配置檔案的推薦方法。
 
Linux系統出現了效能問題,一般我們可以透過top、iostat、free、vmstat等命令來檢視初步定位問題。其中iostat可以給我們提供豐富的IO狀態資料。
基本使用
$iostat -d -k 1 10
引數 -d 表示,顯示裝置(磁碟)使用狀態;-k某些使用block為單位的列強制使用Kilobytes為單位;1 10表示,資料顯示每隔1秒重新整理一次,共顯示10次。
 
# iostat -x 1 10
Linux 2.6.18-92.el5xen    02/03/2009
avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           1.10    0.00    4.82   39.54    0.07   54.46
Device:         rrqm/s   wrqm/s   r/s   w/s   rsec/s   wsec/s avgrq-sz avgqu-sz   await  svctm  %util
sda               0.00     3.50  0.40  2.50     5.60    48.00    18.48     0.00    0.97   0.97   0.28
sdb               0.00     0.00  0.00  0.00     0.00     0.00     0.00     0.00    0.00   0.00   0.00
sdc               0.00     0.00  0.00  0.00     0.00     0.00     0.00     0.00    0.00   0.00   0.00
sdd               0.00     0.00  0.00  0.00     0.00     0.00     0.00     0.00    0.00   0.00   0.00
sde               0.00     0.10  0.30  0.20     2.40     2.40     9.60     0.00    1.60   1.60   0.08
sdf              17.40     0.50 102.00  0.20 12095.20     5.60   118.40     0.70    6.81   2.09  21.36
sdg             232.40     1.90 379.70  0.50 76451.20    19.20   201.13     4.94   13.78   2.45  93.16
rrqm/s:   每秒進行 merge 的讀運算元目。即 delta(rmerge)/s
wrqm/s:  每秒進行 merge 的寫運算元目。即 delta(wmerge)/s
r/s:           每秒完成的讀 I/O 裝置次數。即 delta(rio)/s
w/s:         每秒完成的寫 I/O 裝置次數。即 delta(wio)/s
rsec/s:    每秒讀扇區數。即 delta(rsect)/s
wsec/s:  每秒寫扇區數。即 delta(wsect)/s
rkB/s:      每秒讀K位元組數。是 rsect/s 的一半,因為每扇區大小為512位元組。(需要計算)
wkB/s:    每秒寫K位元組數。是 wsect/s 的一半。(需要計算)
avgrq-sz: 平均每次裝置I/O操作的資料大小 (扇區)。delta(rsect+wsect)/delta(rio+wio)
avgqu-sz: 平均I/O佇列長度。即 delta(aveq)/s/1000 (因為aveq的單位為毫秒)。
await:    平均每次裝置I/O操作的等待時間 (毫秒)。即 delta(ruse+wuse)/delta(rio+wio)
svctm:   平均每次裝置I/O操作的服務時間 (毫秒)。即 delta(use)/delta(rio+wio)
%util:      一秒中有百分之多少的時間用於 I/O 操作,或者說一秒中有多少時間 I/O 佇列是非空的。即 delta(use)/s/1000 (因為use的單位為毫秒)
如果 %util 接近 100%,說明產生的I/O請求太多,I/O系統已經滿負荷,該磁碟
可能存在瓶頸。
idle小於70% IO壓力就較大了,一般讀取速度有較多的wait.
同時可以結合vmstat 檢視檢視b引數(等待資源的程式數)和wa引數(IO等待所佔用的CPU時間的百分比,高過30%時IO壓力高)
另外還可以參考
一般:
svctm < await (因為同時等待的請求的等待時間被重複計算了),
svctm的大小一般和磁碟效能有關:CPU/記憶體的負荷也會對其有影響,請求過多也會間接導致 svctm 的增加。
await: await的大小一般取決於服務時間(svctm) 以及 I/O 佇列的長度和 I/O 請求的發出模式。
如果 svctm 比較接近 await,說明I/O 幾乎沒有等待時間;
如果 await 遠大於 svctm,說明 I/O佇列太長,應用得到的響應時間變慢,
如果響應時間超過了使用者可以容許的範圍,這時可以考慮更換更快的磁碟,調整核心 elevator演算法,最佳化應用,或者升級 CPU。
佇列長度(avgqu-sz)也可作為衡量系統 I/O 負荷的指標,但由於 avgqu-sz 是按照單位時間的平均值,所以不能反映瞬間的 I/O 洪水。
  別人一個不錯的例子.(I/O 系統 vs. 超市排隊)
舉一個例子,我們在超市排隊 checkout 時,怎麼決定該去哪個交款臺呢? 首當是看排的隊人數,5個人總比20人要快吧?除了數人頭,我們也常常看看前面人購買的東西多少,如果前面有個採購了一星期食品的大媽,那麼可以考慮換個隊排了。還有就是收銀員的速度了,如果碰上了連錢都點不清楚的新手,那就有的等了。另外,時機也很重要,可能 5分鐘前還人滿為患的收款臺,現在已是人去樓空,這時候交款可是很爽啊,當然,前提是那過去的 5 分鐘裡所做的事情比排隊要有意義(不過我還沒發現什麼事情比排隊還無聊的)。
I/O 系統也和超市排隊有很多類似之處:
r/s+w/s 類似於交款人的總數
平均佇列長度(avgqu-sz)類似於單位時間裡平均排隊人的個數
平均服務時間(svctm)類似於收銀員的收款速度
平均等待時間(await)類似於平均每人的等待時間
平均I/O資料(avgrq-sz)類似於平均每人所買的東西多少
I/O 操作率 (%util)類似於收款臺前有人排隊的時間比例。
我們可以根據這些資料分析出 I/O 請求的模式,以及 I/O 的速度和響應時間。
下面是別人寫的這個引數輸出的分析
# iostat -x 1
avg-cpu:  %user   %nice    %sys   %idle
16.24    0.00    4.31   79.44
Device:    rrqm/s wrqm/s   r/s   w/s  rsec/s  wsec/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await  svctm  %util
/dev/cciss/c0d0
0.00  44.90  1.02 27.55    8.16  579.59     4.08   289.80    20.57    22.35   78.21   5.00  14.29
/dev/cciss/c0d0p1
0.00  44.90  1.02 27.55    8.16  579.59     4.08   289.80    20.57    22.35   78.21   5.00  14.29
/dev/cciss/c0d0p2
0.00   0.00  0.00  0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00   0.00   0.00
上面的 iostat 輸出表明秒有 28.57 次裝置 I/O 操作: 總IO(io)/s = r/s(讀) +w/s(寫) = 1.02+27.55 = 28.57 (次/秒) 其中寫操作佔了主體 (w:r = 27:1)。
平均每次裝置 I/O 操作只需要 5ms 就可以完成,但每個 I/O 請求卻需要等上 78ms,為什麼? 因為發出的 I/O 請求太多 (每秒鐘約 29 個),假設這些請求是同時發出的,那麼平均等待時間可以這樣計算:
平均等待時間 = 單個 I/O 服務時間 * ( 1 + 2 + ... + 請求總數-1) / 請求總數
應用到上面的例子: 平均等待時間 = 5ms * (1+2+...+28)/29 = 70ms,和 iostat 給出的78ms 的平均等待時間很接近。這反過來表明 I/O 是同時發起的。
每秒發出的 I/O 請求很多 (約 29 個),平均佇列卻不長 (只有 2 個 左右),這表明這 29 個請求的到來並不均勻,大部分時間 I/O 是空閒的。
一秒中有 14.29% 的時間 I/O 佇列中是有請求的,也就是說,85.71% 的時間裡 I/O 系統無事可做,所有 29 個 I/O 請求都在142毫秒之內處理掉了。
delta(ruse+wuse)/delta(io) = await = 78.21 => delta(ruse+wuse)/s=78.21 * delta(io)/s = 78.21*28.57 =2232.8,表明每秒內的I/O請求總共需要等待2232.8ms。所以平均佇列長度應為 2232.8ms/1000ms = 2.23,而iostat 給出的平均佇列長度 (avgqu-sz) 卻為 22.35,為什麼?! 因為 iostat 中有 bug,avgqu-sz值應為 2.23,而不是 22.35。
 
 
Input Output statistics (  iostat )
  iostat反映了終端、磁碟I/O情況和CPU活動。輸出結果的第一行是從系統啟動到現在為止的這段時間的結果,接下去的每一行是interval時
間段內的結果。Kernel裡有一組計數器用來跟蹤這些值。
  iostat的預設引數是tdc(terminal,  disk, and CPU)。如果任何其他的選項被指定,這個預設引數將被完全替代,例如,iostat -d將只反
映磁碟的統計結果。
語法:
基本語法: iostat  ;   interval  count
option - 讓你指定所需資訊的裝置,像磁碟、cpu或者終端(-d , -c , -t  or -tdc ) 。x 選項給出了完整的統計結果(gives the extended
statistic)。
interval -  在兩個samples之間的時間(秒)。
count  - 就是需要統計幾次
例子:
$ iostat -xtc 5 2
                          extended disk statistics       tty         cpu
     disk r/s  w/s Kr/s Kw/s wait actv svc_t  %w  %b  tin tout us sy wt id
     sd0   2.6 3.0 20.7 22.7 0.1  0.2  59.2   6   19   0   84  3  85 11 0
     sd1   4.2 1.0 33.5  8.0 0.0  0.2  47.2   2   23
     sd2   0.0 0.0  0.0  0.0 0.0  0.0   0.0   0    0
     sd3  10.2 1.6 51.4 12.8 0.1  0.3  31.2   3   31

     The fields have the following meanings:
      disk    name of the disk
      r/s     reads per second
      w/s     writes per second
      Kr/s    kilobytes read per second
      Kw/s    kilobytes written per second
      wait    average number of transactions waiting for service (Q length)
      actv    average number of transactions  actively 
              being serviced (removed  from  the
              queue but not yet
              completed)
      %w      percent of time there are transactions  waiting
              for service (queue non-empty)
      %b      percent of time the disk is busy  (transactions
                  in progress)
 

Results and Solutions:
從iostat輸出結果中需要注意的值:
Reads/writes  per second (r/s , w/s)
Percentage busy (%b)
Service time (svc_t)
如果磁碟顯示長時間的高reads/writes,並且磁碟的percentage busy (%b)也遠大於5%,同時average service time  (svc_t)也遠大於30
milliseconds,這以下的措施需要被執行:
1.)調整應用,令其使用磁碟i/o更加有效率,可以透過修改磁碟佇列、使用應用伺服器的cache
2.)將檔案系統分佈到2個或多個磁碟上,並使用volume manager/disksuite的條帶化特點
3.) 增加系統引數值,如inode cache  , ufs_ninode。Increase the system parameter values for  inode cache  , ufs_ninode ,  which
is  Number of inodes to be held in memory. Inodes are cached globally (for UFS), not on a per-file system basis 
4.) 將檔案系統移到更快的磁碟/控制器,或者用更好的裝置來代替
vmstat是Virtual Meomory Statistics(虛擬記憶體統計)的縮寫,可對作業系統的虛擬記憶體、程式、CPU活動進行監控。他是對系統的整體情況進行統計,不足之處是無法對某個程式進行深入分析。通常使用vmstat 5 5(表示在5秒時間內進行5次取樣)命令測試。將得到一個資料彙總他能夠反映真正的系統情況。
#vmstat 5 5
procs -----------memory---------- ---swap-- -----io---- --system-- ----cpu----
r b   swpd   free   buff cache   si   so    bi    bo   in    cs us sy id wa
1 0 62792   3460   9116 88092    6   30   189    89 1061   569 17 28 54 2
0 0 62792   3400   9124 88092    0    00    14 884   434 4 14 81 0
0 0 62792   3400   9132 88092    0    00    14 877   424 4 15 81 0
1 0 62792   3400   9140 88092    0    00    14 868   418 6 20 74 0
1 0 62792   3400   9148 88092    0    00    15 847   400 9 25 67 0
Linux 記憶體監控vmstat命令輸出分成六個部分:

(1)程式procs:
r:在執行佇列中等待的程式數 。
b:在等待io的程式數 。

(2)Linux 記憶體監控記憶體memoy:
swpd:現時可用的交換記憶體(單位KB)。
free:空閒的記憶體(單位KB)。
buff: 緩衝去中的記憶體數(單位:KB)。
cache:被用來做為快取記憶體的記憶體數(單位:KB)。

(3) Linux 記憶體監控swap交換頁面
si: 從磁碟交換到記憶體的交換頁數量,單位:KB/秒。
so: 從記憶體交換到磁碟的交換頁數量,單位:KB/秒。

(4)Linux 記憶體監控 io塊裝置:
bi: 傳送到塊裝置的塊數,單位:塊/秒。
bo: 從塊裝置接收到的塊數,單位:塊/秒。

(5)Linux 記憶體監控system系統:
in: 每秒的中斷數,包括時鐘中斷。
cs: 每秒的環境(上下文)轉換次數。

(6)Linux 記憶體監控cpu中央處理器:
cs:使用者程式使用的時間 。以百分比表示。
sy:系統程式使用的時間。 以百分比表示。
id:中央處理器的空閒時間 。以百分比表示。

假如 r經常大於 4 ,且id經常小於40,表示中央處理器的負荷很重。 假如bi,bo 長期不等於0,表示實體記憶體容量太小
 
free命令用來顯示記憶體使用情況。display information about free and used memory on the system。
常用引數
b 以位元組為單位顯示。
-k 以K位元組為單位顯示。預設顯示。
-m 以兆位元組為單位顯示。
 
-s 每隔多少秒重複執行。可編寫一個指令碼用於監控。
使用示例
示例一
[root@sunrise root]# free
                    total        used        free     shared    buffers     cached
Mem:       4091428    4073120      18308          0     112784    2564792
-/+ buffers/cache:    1395544    2695884
Swap:      8385888          0    8385888
[root@sunrise root]#
 
 
數值的單位是KBytes。

Mem開頭的行:
total是指記憶體總數。比如這臺機器4G記憶體,實際上已經扣除掉了作為視訊記憶體的部分。
used是指作業系統已經使用的記憶體數。這部分既包括作業系統本身使用的部分,也包括應用程式已經使用的部分,還包括快取的部分。
free是指作業系統還沒有使用的記憶體數。我們通常看到這部分比較小。
shared已經廢棄不用,總是顯示0。
buffers和cached是指作為快取的記憶體數。

-/+ buffers/cache開頭的行:(重點看這行)
used列是指應用程式總共使用的記憶體數。等於Mem.used-Mem.buffers-Mem.cached。
free列是指應用程式還未使用的記憶體數。這個資料才是我們需要關注的空閒可用記憶體數。等於Mem.free+Mem.buffers+Mem.cached。
如果此行中free列的資料太小,那麼就需要最佳化程式或者增加實體記憶體了。
 
示例二
[root@bbqztweb root]# free -s 60
             total       used       free     shared    buffers     cached
Mem:       1016532     996320      20212          0      97964     166716
-/+ buffers/cache:     731640     284892
Swap:      2040244     281544    1758700
             total       used       free     shared    buffers     cached
Mem:       1016532     996328      20204          0      97964     166724
-/+ buffers/cache:     731640     284892
Swap:      2040244     281544    1758700
             total       used       free     shared    buffers     cached
Mem:       1016532     996460      20072          0      97964     166724
-/+ buffers/cache:     731772     284760
Swap:      2040244     281544    1758700
             total       used       free     shared    buffers     cached
Mem:       1016532     996316      20216          0      97964     166740
-/+ buffers/cache:     731612     284920
Swap:      2040244     281544    1758700

[root@bbqztweb root]#
 
示例三
free命令實際上是根據/proc/meminfo生成的。-/+ buffers/cache:這行是計算出來的。
[root@bbqztweb root]# free -b; cat /proc/meminfo
             total       used       free     shared    buffers     cached
Mem:    1040928768 1017909248   23019520          0  100220928  172040192
-/+ buffers/cache:  745648128  295280640
Swap:   2089209856  288301056 1800908800
        total:    used:    free:  shared: buffers:  cached:
Mem:  1040928768 1017909248 23019520        0 100220928 371302400
Swap: 2089209856 288301056 1800908800
MemTotal:      1016532 kB
MemFree:         22480 kB
MemShared:           0 kB
Buffers:         97872 kB
Cached:         168008 kB
SwapCached:     194592 kB
Active:         667076 kB
ActiveAnon:     510760 kB
ActiveCache:    156316 kB
Inact_dirty:    125964 kB
Inact_laundry:   20508 kB
Inact_clean:     17308 kB
Inact_target:   166168 kB
HighTotal:      122044 kB
HighFree:         5564 kB
LowTotal:       894488 kB
LowFree:         16916 kB
SwapTotal:     2040244 kB
SwapFree:      1758700 kB
CommitLimit:   2548508 kB
Committed_AS:  1063004 kB
HugePages_Total:     0
HugePages_Free:      0
Hugepagesize:     2048 kB
[root@bbqztweb root]#
 
示例四
[root@bbqztweb root]# free -b -s 1 | grep 'buffers/cache:'
-/+ buffers/cache:  745574400  295354368
-/+ buffers/cache:  745574400  295354368
-/+ buffers/cache:  745574400  295354368
Ctrl+C
[root@bbqztweb root]# free -b -s 1 | grep 'buffers/cache:' | awk '{print $4}'
Ctrl+C
怪哉,沒有顯示任何輸出。但下面的是可以輸出東西的,難道管道線多了就不靈了?why?
[root@bbqztweb root]# free -b -s 1 | awk '{print $4}'                        
shared
22200320
295211008
1800908800
shared
22200320
295211008
1800908800

Netstat命令用於顯示與IP、TCP、UDP和ICMP協議相關的統計資料,一般用於檢驗本機各埠的網路連線情況。
       在Internet RFC標準中,Netstat的定義是: Netstat是在核心中訪問網路及相關資訊的程式,它能提供TCP連線,TCP和UDP監聽,程式記憶體管理的相關報告。
 
檢查2222 埠的相關資訊:
[root@singledb ~]# netstat -an |grep 2222
tcp        0      0 :::2222                     :::*                        LISTEN    
tcp        0      0 ::ffff:192.168.3.200:2222   ::ffff:192.168.3.115:53516  ESTABLISHED
     
 
該命令的幫助文件如下:
[root@singledb ~]# netstat -h
usage: netstat [-veenNcCF] [] -r         netstat {-V|--version|-h|--help}
       netstat [-vnNcaeol] [ ...]
       netstat { [-veenNac] -I[] | [-veenNac] -i | [-cnNe] -M | -s } [delay]
 
        -r, --route                display routing table
        -I, --interfaces=[] display interface table for
        -i, --interfaces           display interface table
        -g, --groups               display multicast group memberships
        -s, --statistics           display networking statistics (like SNMP)
        -M, --masquerade           display masqueraded connections
        -v, --verbose              be verbose
        -n, --numeric              don't resolve names
        --numeric-hosts            don't resolve host names
        --numeric-ports            don't resolve port names
        --numeric-users            don't resolve user names
        -N, --symbolic             resolve hardware names
        -e, --extend               display other/more information
        -p, --programs             display PID/Program name for sockets
        -c, --continuous           continuous listing
        -l, --listening            display listening server sockets
        -a, --all, --listening     display all sockets (default: connected)
        -o, --timers               display timers
        -F, --fib            display Forwarding Information Base (default)
        -C, --cache                display routing cache instead of FIB
        -T, --notrim               stop trimming long addresses
        -Z, --context              display SELinux security context for sockets
 
  : Name of interface to monitor/list.
  ={-t|--tcp} {-u|--udp} {-S|--sctp} {-w|--raw} {-x|--unix} --ax25 --ipx --netrom
  =Use '-A ' or '--'; default: inet
  List of possible address families (which support routing):
    inet (DARPA Internet) inet6 (IPv6) ax25 (AMPR AX.25)
    netrom (AMPR NET/ROM) ipx (Novell IPX) ddp (Appletalk DDP)
    x25 (CCITT X.25)
     
       在上面的命令裡講了一個引數的意思。 如果想檢視更詳細的內容,可以使用man命令。 這個可以顯示的更詳細。
 
 
Netstat的一些常用選項 :
       netstat -s: 按照各個協議分別顯示其統計資料。
       netstat -r: 顯示關於路由表的資訊。
netstat -a: 顯示一個所有的有效連線資訊列表.
       netstat -n: 顯示所有已建立的有效連線。
 
 
[root@singledb ~]# netstat -a
Active Internet connections (servers and established)
Proto Recv-Q Send-Q Local Address               Foreign Address             State    
tcp        0      0 localhost.localdomain:2208  *:*                         LISTEN       
tcp        0      0 192.168.122.1:domain        *:*                         LISTEN     
tcp        0      0 ::ffff:192.168.3.200:ssh    ::ffff:192.168.3.115:51710  ESTABLISHED
tcp        0      0 ::ffff:192.16:rockwell-csp2 ::ffff:192.168.3.115:53516  ESTABLISHED
udp        0      0 *:48902                     *:*                                   
udp        0      0 192.168.122.1:domain        *:*                                                                     
udp        0      0 *:mdns                      *:*                                   
Active UNIX domain sockets (servers and established)
Proto RefCnt Flags       Type       State         I-Node Path
unix  2      [ ACC ]     STREAM     LISTENING     6166   @ISCSIADM_ABSTRACT_NAMESPACE
unix  28     [ ]         DGRAM                    6709   /dev/log
unix  2      [ ACC ]     STREAM     LISTENING     9022   /dev/gpmctl
unix  2      [ ACC ]     STREAM     LISTENING     6702   /var/run/audispd_events
 
以其中一條做說明:
tcp        0      0 ::ffff:192.168.3.200:ssh    ::ffff:192.168.3.115:51710  ESTABLISHED
 
協議(Proto):TCP,指是傳輸層通訊協議。
有關TCP, 可以參考Blog:
       網路七層協議 說明
 
Local  Address:::ffff:192.168.3.200:ssh,本地的IP地址,和用於連線的埠, 這裡寫成ssh了。 指的是SSH 埠。 
Foreign Address: ffff:192.168.3.115:51710, 遠端機器的的IP地址和連線的埠。
State:ESTABLISHED。 連線狀態。可有一下幾種狀態:
                     LISTEN  :在監聽狀態中。 
                     ESTABLISHED:已建立聯機的聯機情況。
                     TIME_WAIT:該聯機在目前已經是等待的狀態。
 
 
 [root@singledb ~]# netstat -n
Active Internet connections (w/o servers)
Proto Recv-Q Send-Q Local Address               Foreign Address             State    
tcp        0    132 ::ffff:192.168.3.200:22     ::ffff:192.168.3.115:51710  ESTABLISHED
tcp        0      0 ::ffff:192.168.3.200:2222   ::ffff:192.168.3.115:53516  ESTABLISHED
--剛才這裡顯示的SSH。 現在顯示成對應的埠了。
Active UNIX domain sockets (w/o servers)
Proto RefCnt Flags       Type       State         I-Node Path
unix  28     [ ]         DGRAM                    6709   /dev/log
unix  2      [ ]         DGRAM                    1413   @/org/kernel/udev/udevd
unix  2      [ ]         DGRAM                    7379   @/org/freedesktop/hal/udev_event
unix  2      [ ]         DGRAM                    15309
unix  2      [ ]         DGRAM                    13877
unix  2      [ ]         DGRAM                    13005
unix  3      [ ]         STREAM     CONNECTED     12935
unix  3      [ ]         STREAM     CONNECTED     12934
unix  2      [ ]         DGRAM                    12930
 
 
 Netstat -n基本上是-a引數的數字形式,-a 和 -n 是最常用的兩個,其中
       (1)-n 顯示用數字化主機名,即IP地址
       (2)-n 只顯示TCP連線
 
 
[root@singledb ~]# netstat -r
Kernel IP routing table
Destination     Gateway         Genmask         Flags   MSS Window  irtt Iface
192.168.3.0     *               255.255.255.0   U         0 0          0 bond0
192.168.122.0   *               255.255.255.0   U         0 0          0 virbr0
169.254.0.0     *               255.255.0.0     U         0 0          0 bond0
default         192.168.3.1     0.0.0.0         UG        0 0          0 bond0  
 
 
[root@singledb ~]# netstat -s
Ip:
    63105 total packets received
    0 forwarded
    0 incoming packets discarded
    41834 incoming packets delivered
    33322 requests sent out
Icmp:
    1377 ICMP messages received
    0 input ICMP message failed.
    ICMP input histogram:
        destination unreachable: 1377
    1377 ICMP messages sent
    0 ICMP messages failed
    ICMP output histogram:
        destination unreachable: 1377
IcmpMsg:
        InType3: 1377
        OutType3: 1377
Tcp:
    147 active connections openings
    33 passive connection openings
    0 failed connection attempts
    0 connection resets received
    2 connections established
    31684 segments received
    31347 segments send out
    393 segments retransmited
    0 bad segments received.
    0 resets sent
Udp:
    132 packets received
    1 packets to unknown port received.
    0 packet receive errors
    201 packets sent
TcpExt:
    23 TCP sockets finished time wait in fast timer
    7032 delayed acks sent
    10 delayed acks further delayed because of locked socket
    Quick ack mode was activated 8137 times
    2 packets directly queued to recvmsg prequeue.
    2 packets directly received from prequeue
    3496 packets header predicted
    2325 acknowledgments not containing data received
    7805 predicted acknowledgments
    6 times recovered from packet loss due to SACK data
    TCPDSACKUndo: 3
    12 congestion windows recovered after partial ack
    3 TCP data loss events
    5 fast retransmits
    3 retransmits in slow start
    137 other TCP timeouts
    2 sack retransmits failed
    8137 DSACKs sent for old packets
    24 DSACKs received
IpExt:
    InMcastPkts: 36
    OutMcastPkts: 40
    InBcastPkts: 8617
[root@singledb ~]#

 

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/8013558/viewspace-751242/,如需轉載,請註明出處,否則將追究法律責任。

相關文章