Linux程式管理與效能監控

說故事的五公子發表於2020-08-20

1. 程式管理工具

這一節我們介紹程式管理工具;

使用程式管理工具,我們可以查詢程式當前的執行狀態,或終止一個程式;

任何程式都與檔案關聯;我們會用到lsof工具(list opened files),作用是列舉系統中已經被開啟的檔案。在linux環境中,任何事物都是檔案,裝置是檔案,目錄是檔案,甚至sockets也是檔案。用好lsof命令,對日常的linux管理非常有幫助。

1.1. 查詢程式

查詢正在執行的程式資訊

$ps -ef

eg:查詢歸屬於使用者colin115的程式

$ps -ef | grep colin115
$ps -lu colin115

查詢程式ID(適合只記得部分程式欄位)

$pgrep 查詢程式

eg:查詢程式名中含有re的程式
[/home/weber#]pgrep -l re
2 kthreadd
28 ecryptfs-kthrea
29515 redis-server

以完整的格式顯示所有的程式

$ps -ajx

顯示程式資訊,並實時更新

$top

檢視埠占用的程式狀態:

lsof -i:3306

檢視使用者username的程式所開啟的檔案

$lsof -u username

查詢init程式當前開啟的檔案

$lsof -c init

查詢指定的程式ID(23295)開啟的檔案:

$lsof -p 23295

查詢指定目錄下被程式開啟的檔案(使用+D 遞迴目錄):

$lsof +d mydir1/

1.2. 終止程式

殺死指定PID的程式 (PID為Process ID)

$kill PID

殺死相關程式

kill -9 3434

殺死job工作 (job為job number)

$kill %job

1.3. 程式監控

檢視系統中使用CPU、使用記憶體最多的程式;

$top
(->)P

輸入top命令後,進入到互動介面;接著輸入字元命令後顯示相應的程式狀態:

對於程式,平時我們最常想知道的就是哪些程式佔用CPU最多,佔用記憶體最多。以下兩個命令就可以滿足要求:

P:根據CPU使用百分比大小進行排序。
M:根據駐留記憶體大小進行排序。
i:使top不顯示任何閒置或者僵死程式。

這裡介紹最使用的幾個選項,對於更詳細的使用,詳見top linux下的工作管理員

1.4. 分析執行緒棧

使用命令pmap,來輸出程式記憶體的狀況,可以用來分析執行緒堆疊;

$pmap PID

eg:
[/home/weber#]ps -fe| grep redis
weber    13508 13070  0 08:14 pts/0    00:00:00 grep --color=auto redis
weber    29515     1  0  2013 ?        02:55:59 ./redis-server redis.conf
[/home/weber#]pmap 29515
29515:   ./redis-server redis.conf
08048000    768K r-x--  /home/weber/soft/redis-2.6.16/src/redis-server
08108000      4K r----  /home/weber/soft/redis-2.6.16/src/redis-server
08109000     12K rw---  /home/weber/soft/redis-2.6.16/src/redis-server

1.5. 綜合運用

將使用者colin115下的所有程式名以av_開頭的程式終止:

ps -u colin115 |  awk '/av_/ {print "kill -9 " $1}' | sh

將使用者colin115下所有程式名中包含HOST的程式終止:

ps -fe| grep colin115|grep HOST |awk '{print $2}' | xargs kill -9;

2.效能監控

在使用作業系統的過程中,我們經常需要檢視當前的效能如何,需要了解CPU、記憶體和硬碟的使用情況; 本節介紹的這幾個工具能滿足日常工作要求;

2.1. 監控CPU

檢視CPU使用率

$sar -u

eg:
$sar -u 1 2
[/home/weber#]sar -u 1 2
Linux 2.6.35-22-generic-pae (MyVPS)     06/28/2014      _i686_  (1 CPU)

09:03:59 AM     CPU     %user     %nice   %system   %iowait    %steal     %idle
09:04:00 AM     all      0.00      0.00      0.50      0.00      0.00     99.50
09:04:01 AM     all      0.00      0.00      0.00      0.00      0.00    100.00

後面的兩個參數列示監控的頻率,比如例子中的1和2,表示每秒取樣一次,總共取樣2次;

檢視CPU平均負載

$sar -q 1 2

sar指定-q後,就能檢視執行佇列中的程式數、系統上的程式大小、平均負載等;

2.2. 查詢記憶體

檢視記憶體使用狀況 sar指定-r之後,可檢視記憶體使用狀況;

$sar -r 1 2
09:08:48 AM kbmemfree kbmemused  %memused kbbuffers  kbcached  kbcommit   %commit  kbactive   kbinact
09:08:49 AM     17888    359784     95.26     37796     73272    507004     65.42    137400    150764
09:08:50 AM     17888    359784     95.26     37796     73272    507004     65.42    137400    150764
Average:        17888    359784     95.26     37796     73272    507004     65.42    137400    150764

檢視記憶體使用量

$free -m

2.3. 查詢頁面交換

檢視頁面交換髮生狀況 頁面發生交換時,伺服器的吞吐量會大幅下降;伺服器狀況不良時,如果懷疑因為記憶體不足而導致了頁面交換的發生,可以使用sar -W這個命令來確認是否發生了大量的交換;

$sar -W 1 3

2.4. 查詢硬碟使用

檢視磁碟空間利用情況

$df -h

查詢當前目錄下空間使用情況

du -sh  -h是人性化顯示 s是遞迴整個目錄的大小

檢視該目錄下所有資料夾的排序後的大小

for i in `ls`; do du -sh $i; done | sort
或者
du -sh `ls`

2.5. 綜合應用

當系統中sar不可用時,可以使用以下工具替代:linux下有 vmstat、Unix系統有prstat

eg: 檢視cpu、記憶體、使用情況: vmstat n m (n 為監控頻率、m為監控次數)

[/home/weber#]vmstat 1 3
procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu----
r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa
0  0  86560  42300   9752  63556    0    1     1     1    0    0  0  0 99  0
1  0  86560  39936   9764  63544    0    0     0    52   66   95  5  0 95  0
0  0  86560  42168   9772  63556    0    0     0    20  127  231 13  2 84  0

使用watch 工具監控變化 當需要持續的監控應用的某個資料變化時,watch工具能滿足要求; 執行watch命令後,會進入到一個介面,輸出當前被監控的資料,一旦資料變化,便會高亮顯示變化情況;

eg:操作redis時,監控記憶體變化:

$watch -d -n 1 './redis-cli info | grep memory'
(以下為watch工具中的介面內容,一旦記憶體變化,即實時高亮顯示變化)
Every 1.0s: ./redis-cli info | grep memory            

used_memory:45157376
used_memory_human:43.07M
used_memory_rss:47628288
used_memory_peak:49686080
used_memory_peak_human:47.38M

相關文章