在 Linux 中使用 top 命令的建議

Katie Mclaughlin發表於2018-08-21

通過這篇教程提升你的 top 命令的知識。

嘗試找出你的機器正在執行什麼程式,以及哪個程式耗盡了記憶體導致系統非常非常慢 —— 這是 top 命令所能勝任的工作。

top 是一個非常有用的程式,其作用類似於 Windows 工作管理員或 MacOS 的活動監視器。在 *nix 機器上執行 top 將實時顯示系統上執行的程式的情況。

$ top

取決於你執行的 top 版本,你會看到類似如下內容:

top - 08:31:32 up 1 day,  4:09,  0 users,  load average: 0.20, 0.12, 0.10
Tasks:   3 total,   1 running,   2 sleeping,   0 stopped,   0 zombie
%Cpu(s):  0.5 us,  0.3 sy,  0.0 ni, 99.2 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
KiB Mem:   4042284 total,  2523744 used,  1518540 free,   263776 buffers
KiB Swap:  1048572 total,        0 used,  1048572 free.  1804264 cached Mem

  PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND
    1 root      20   0   21964   3632   3124 S   0.0  0.1   0:00.23 bash
  193 root      20   0  123520  29636   8640 S   0.0  0.7   0:00.58 flask
  195 root      20   0   23608   2724   2400 R   0.0  0.1   0:00.21 top

你所用的 top 版本可能跟這個看起來不一樣,特別是在顯示的列上。

如何閱讀輸出的內容

你可以根據輸出判斷你正在執行的內容,但嘗試去解釋結果你可能會有些困惑。

前幾行包含一堆統計資訊(詳細資訊),後跟一個包含結果列的表(列)。讓我們從後者開始吧。

這些是系統正在執行的程式。預設按 CPU 使用率降序排序。這意味著在列表頂部的程式正使用更多的 CPU 資源並對你的系統造成更重的負擔。對於資源使用而言,這些程式是字面上的消耗資源最多的(top)程式。不得不說,top 這個名字起得很妙。

最右邊的 COMMAND 一列報告程式名(啟動它們的命令)。在這個例子裡,程式名是 bash(一個我們正在執行 top 的命令直譯器)、flask(一個 Python 寫的 web 框架)和 top 自身。

其它列提供了關於程式的有用資訊:

  • PID:程式 ID,一個用來定位程式的唯一識別符號
  • USER:執行程式的使用者
  • PR:任務的優先順序
  • NI:Nice 值,優先順序的一個更好的表現形式
  • VIRT:虛擬記憶體的大小,單位是 KiB(kibibytes)
  • RES:常駐記憶體大小,單位是 KiB(實體記憶體和虛擬記憶體的一部分)
  • SHR:共享記憶體大小,單位是 KiB(共享記憶體和虛擬記憶體的一部分)
  • S:程式狀態,一般 I 代表空閒,R 代表執行,S 代表休眠,Z 代表殭屍程式,Tt 代表停止(還有其它更少見的選項)
  • %CPU:自從上次螢幕更新後的 CPU 使用率
  • %MEM:自從上次螢幕更新後的 RES 常駐記憶體使用率
  • TIME+:自從程式啟動後總的 CPU 使用時間
  • COMMAND:啟動命令,如之前描述那樣

確切知道 VIRTRESSHR 值代表什麼在日常操作中並不重要。重要的是要知道 VIRT 值最高的程式就是記憶體使用最多的程式。當你在用 top 排查為什麼你的電腦執行無比卡的時候,那個 VIRT 數值最大的程式就是元凶。如果你想要知道共享記憶體和實體記憶體的確切意思,請查閱 top 手冊的 Linux Memory Types 段落。

是的,我說的是 kibibytes 而不是 kilobytes。通常稱為 kilobyte 的 1024 值實際上是 kibibyte。希臘語的 kilo(χίλιοι)意思是一千(例如一千米是 1000 米,一千克是 1000 克)。Kibi 是 kilo 和 binary 的合成詞,意思是 1024 位元組(或者 210 )。但是,因為這個詞很難說,所以很多人在說 1024 位元組的時候會說 kilobyte。top 試圖在這裡使用恰當的術語,所以按它說的理解就好。

螢幕更新說明

實時螢幕更新是 Linux 程式可以做的 非常酷 的事之一。這意味著程式能實時更新它們顯示的內容,所以看起來是動態的,即使它們用的是文字。非常酷!在我們的例子中,更新時間間隔很重要,因為一些統計資料(%CPU%MEM)是基於上次螢幕更新的數值的。

因為我們執行在一個永續性的程式中,我們就可以輸入一些命令來實時修改配置(而不是停止應用,然後用一個不同的命令列選項再次執行)。

按下 h 呼叫幫助介面,該介面也顯示了預設延遲(螢幕更新的時間間隔)。這個值預設(大約)是 3 秒,但你可以輸入 d(大概是 delay 的意思)或者 s(可能是 screen 或 seconds 的意思)來修改它。

細節

在程式列表上面有一大堆有用的資訊。有些細節看起來有點兒奇怪,讓人困惑。但是一旦你花點兒時間來逐個過一遍,你會發現,在緊要關頭,這些是非常有用的。

第一行包含系統的大致資訊:

  • top:我們正在執行 top!你好!top
  • XX:YY:XX:當前時間,每次螢幕更新的時候更新
  • up(接下去是 X day, YY:ZZ):系統的 uptime,或者自從系統啟動後已經過去了多長時間
  • load average(後跟三個數字):分別是過去一分鐘、五分鐘、15 分鐘的系統負載

第二行(Task)顯示了正在執行的任務的資訊,不用解釋。它顯示了程式總數和正在執行的、休眠中的、停止的程式數和殭屍程式數。這實際上是上述 S(狀態)列的總和。

第三行(%Cpu(s))顯示了按型別劃分的 CPU 使用情況。資料是螢幕重新整理之間的值。這些值是:

  • us:使用者程式
  • sy:系統程式
  • ninice 使用者程式
  • id:CPU 的空閒時間,這個值比較高時說明系統比較空閒
  • wa:等待時間,或者消耗在等待 I/O 完成的時間
  • hi:消耗在硬體中斷的時間
  • si:消耗在軟體中斷的時間
  • st:“虛擬機器管理程式從該虛擬機器竊取的時間”

你可以通過點選 t(toggle)來展開或摺疊 Task%Cpu(s) 行。

第四行(Kib Mem)和第五行(KiB Swap)提供了記憶體和交換空間的資訊。這些數值是:

  • 總記憶體容量
  • 已用記憶體
  • 空閒記憶體
  • 記憶體的緩衝值
  • 交換空間的快取值

預設它們是用 KiB 為單位展示的,但是按下 E(擴充套件記憶體縮放 extend memory scaling)可以輪換不同的單位:KiB、MiB、GiB、TiB、PiB、EiB(kilobytes、megabytes、gigabytes、terabytes、petabytes 和 exabytes)

top 使用者手冊有更多選項和配置項資訊。你可以執行 man top 來檢視你係統上的文件。還有很多 HTML 版的 man 手冊,但是請留意,這些手冊可能是針對不同 top 版本的。

兩個 top 的替代品

你不必總是用 top 檢視系統狀態。你可以根據你的情況用其它工具來協助排查問題,尤其是當你想要更圖形化或更專業的介面的時候。

htop

htop 很像 top,但是它帶來了一些非常有用的東西:它可以以圖形介面展示 CPU 和記憶體使用情況。

這是我們在剛才執行 top 的同一環境中 htop 的樣子。顯示更簡潔,但功能卻很豐富。

任務統計、負載、uptime 和程式列表仍然在,但是它有了漂亮、彩色、動態的每核 CPU 使用情況,還有圖形化的記憶體使用情況。

以下是不同顏色的含義(你也可以通過按下 h 來獲得這些資訊的幫助)。

CPU 任務優先順序或型別:

  • 藍色:低優先順序
  • 綠色:正常優先順序
  • 紅色:核心任務
  • 藍色:虛擬任務
  • 條狀圖末尾的值是已用 CPU 的百分比

記憶體:

  • 綠色:已經使用的記憶體
  • 藍色:緩衝的記憶體
  • 黃色:快取記憶體
  • 條狀圖末尾的值顯示已用記憶體和總記憶體

如果顏色對你沒用,你可以執行 htop -C 來禁用它們;那樣 htop 將使用不同的符號來展示 CPU 和記憶體型別。

它的底部有一組啟用的快捷鍵提示,可以用來操作過濾結果或改變排序順序。試著按一些快捷鍵看看它們能做什麼。不過嘗試 F9 時要小心,它會調出一個訊號列表,這些訊號會殺死(即停止)一個過程。我建議在生產環境之外探索這些選項。

htop 的作者 Hisham Muhammad(是的,htop 的名字就是源自 Hisham 的)在二月份的 FOSDEM 2018 做了一個簡短的演講。他闡述了 htop 不僅有簡潔的圖形介面,還有更現代的程式資訊統計展示方式,這都是之前的工具(如 top)所不具備的。

你可以在手冊頁面htop 網站閱讀更多關於 htop 的資訊。(提示:網站背景是一個動態的 htop。)

docker stats

如果你在用 Docker,你可以執行 docker stats 來為容器狀態生成一個有豐富上下文的介面。

這可能比 top 更有幫助,因為它不是按程式分類,而是按容器分類的。這點特別有用,當某個容器執行緩慢時,檢視哪個容器耗資源最多比執行 top 再找到容器的程式要快。

藉助於上面對 tophtop 術語的解釋,你應該會更容易理解 docker stats 中的那些。然而,docker stats 文件對每一列都提供了詳盡的描述。


via: https://opensource.com/article/18/8/top-tips-speed-up-computer

作者:Katie McLaughlin 選題:lujun9972 譯者:ypingcn 校對:pityonline

本文由 LCTT 原創編譯,Linux中國 榮譽推出

相關文章