CentOS：作業系統級監控及常用計數器解析---除CPU以外

絲瓜呆呆發表於2021-06-13

原文網址 : https://www.cnblogs.com/siguadd/p/14879636.html

CentOS作業系統

I/O

I/O 其實是挺複雜的一個邏輯，但我們今天只說在做效能分析的時候，應該如何定位問題。

對效能優化比較有經驗的人（或者說見過世面比較多的人）都會知道，當一個系統調到非常精緻的程度時，基本上會卡在兩個環節上，對計算密集型的應用來說，會卡在 CPU 上；對 I/O 密集型的應用來說，瓶頸會卡在 I/O 上。

我們對 I/O 的判斷邏輯關係是什麼呢？

我們先畫一個 I/O 基本的邏輯過程。我們很多人嘴上說 I/O，其實腦子裡想的都是 Disk I/O，但實際上一個資料要想寫到磁碟當中，沒那麼容易，步驟並不簡單。

I/O 有很多原理細節，那我們如何能快速地做出相應的判斷呢？首先要祭出的一個工具就是iostat。

在這張圖中，我們取出一條資料來做詳細看下：

Device: rrqm/s wrqm/s r/s w/s rkB/s wkB/s avgrq-sz
vda 0.00 0.67 18.33 114.33 540.00 54073.33 823.32
avgqu-sz await r_await w_await svctm %util
127.01 776.75 1.76 901.01 7.54 100.00

我解釋一下其中幾個關鍵計數器的含義。

svctm代表 I/O 平均響應時間。請注意，這個計數器，有很多人還把它當個寶一樣，實際上在 man 手冊中已經明確說了：“Warning! Do not trust this field any more. This field will be removed in a future sysstat version.” 也就是說，這個資料你愛看就愛，不一定準。

w_await表示寫入的平均響應時間；r_await表示讀取的平均響應時間；r/s表示每秒讀取次數；w/s表示每秒寫入次數。

而 IO/s 的關鍵計算是這樣的：

IO/s = r/s + w/s = 18.33+114.33 = 132.66
%util = ( (IO/s * svctm) /1000) * 100% = 100.02564%

這個%util是用svctm算來的，既然svctm都不一定準了，那這個值也只能參考了。還好我們還有其他工具可以接著往深了去定位，那就是iotop。

Total DISK READ : 2.27 M/s | Total DISK WRITE : 574.86 M/s
Actual DISK READ: 3.86 M/s | Actual DISK WRITE: 34.13 M/s
TID PRIO USER DISK READ DISK WRITE SWAPIN IO> COMMAND
394 be/3 root 0.00 B/s 441.15 M/s 0.00 % 85.47 % [jbd2/vda1-8]
32616 be/4 root 1984.69 K/s 3.40 K/s 0.00 % 42.89 % kube-controllers
13787 be/4 root 0.00 B/s 0.00 B/s 0.00 % 35.41 % [kworker/u4:1]
...............................

從上面的Total DISK WRITE/READ就可以知道當前的讀寫到底有多少了，預設是按照I/O列來排序的，這裡有Total，也有Actual，並且這兩個並不相等，為什麼呢？

因為 Total 的值顯示的是使用者態程式與核心態程式之間的速度，而 Actual 顯示的是核心塊裝置子系統與硬體之間的速度。

而在I/O互動中，由於存在cache和在核心中會做I/O排序，因此這兩個值並不會相同。那如果你要說磁碟的讀寫能力怎麼樣，我們應該看的是Actual。這個沒啥好說的，因為Total再大，不能真實寫到硬碟上也是沒用的。在下面的執行緒列表中，通過排序，就可以知道是哪個執行緒（注意在第一列是 TID 哦）佔的I/O高了。

Memory

關於記憶體，要說作業系統的記憶體管理，那大概開一個新專欄也不為過。但是在效能測試的專案中，如果不做底層的測試，基本上在上層語言開發的系統中，比如說 Java、Go、C++ 等，在分析過程中都直接看業務系統就好了。在作業系統中，分析業務應用的時候，我們會關注的記憶體內容如下面的命令所示：

[root@7dgroup ~]# free -m             
        total        used        free      shared  buff/cache   available
Mem:           3791        1873         421         174        1495        1512
Swap:             0           0           0
[root@7dgroup ~]#

total肯定是要優先看的，其次是available，這個值才是系統真正可用的記憶體，而不是free。

因為 Linux 通常都會把用的記憶體給cache，但是不一定會用，所以free肯定會越來越少，但是available是計算了buff和cache中不用的記憶體的，所以只要available多，就表示記憶體夠用。

當出現記憶體洩露或因其他原因導致實體記憶體不夠用的時候，作業系統就會呼叫OOM Killer，這個程式會強制殺死消耗記憶體大的應用。這個過程是不商量的，然後你在“dmesg”中就會看到如下資訊。

[12766211.187745] Out of memory: Kill process 32188 (java) score 177 or sacrifice child
[12766211.190964] Killed process 32188 (java) total-vm:5861784kB, anon-rss:1416044kB, file-rss:0kB, shmem-rss:0kB

CentOS：作業系統級監控及常用計數器解析
2021-06-12
CentOS作業系統
DevOps專題 | 大型企業級監控系統設計
2019-10-31
dev
作業系統篇-cpu
2020-10-13
作業系統
伺服器常用的作業系統
2020-05-29
伺服器作業系統
天兔(Lepus)監控作業系統(OS)安裝配置
2019-06-12
作業系統
Linux作業系統效能指標監控與通知
2022-09-30
Linux作業系統指標
作業-安裝虛擬機器以及CentOS作業系統
2018-09-05
虛擬機CentOS作業系統
DBA常用系統監控命令（之一）
2018-03-06
實時監控系統，統一監控企業API
2022-03-10
API
centos7 離線升級/線上升級作業系統核心
2023-04-26
CentOS作業系統
Linux中監控系統效能常用的命令！
2023-12-14
Linux
工業機器人遠端監控系統方案
2021-04-08
機器人
centos 監控
2024-04-14
CentOS
U盤裝CENTOS作業系統
2019-06-21
CentOS作業系統
常用的8個Linux伺服器作業系統！
2023-04-10
Linux伺服器作業系統
Windows效能計數器監控實踐
2019-06-24
Windows
分散式監控系統之Zabbix主動、被動及web監控
2020-11-23
分散式Web
運維文件：系統監控及告警配置
2024-07-26
運維
來！做一個分鐘級業務監控系統【實戰】
2019-07-21
伺服器監控系統部署文件
2024-07-26
伺服器
【系統設計】指標監控和告警系統
2022-07-05
指標
一文詳解Linux系統常用監控工具
2018-09-18
Linux
視訊監控系統的設計
2020-12-04
網站伺服器常用的作業系統介紹
2022-10-04
網站伺服器作業系統
計算機作業系統|作業系統引論
2020-11-14
計算機作業系統
運維文件：伺服器監控系統
2024-07-26
運維伺服器
伺服器監控系統部署與配置
2024-07-26
伺服器
系統活動監控器:iStat Menus Mac
2022-03-21
Mac
iStat Menus for Mac(系統活動監控器)
2021-11-21
Mac
iStat Menus for Mac 系統活動監控器
2022-06-27
Mac
Mac系統活動監控器：iStat Menus
2022-06-21
Mac
win10系統怎麼使用自帶cpu溫度監控
2019-11-19
Win10
golang 必會之 pprof 監控系列(5) —— cpu 佔用率統計原理
2023-04-14
Golang
作業系統常用知識總結！
2022-11-22
作業系統
記憶體CPU監控
2024-03-21
記憶體
.NET 開源實時監控系統 - WatchDog 技術解析
2024-10-18
10多個 Linux 系統管理員必備的監控工具、常用的網站監控工具
2020-12-05
Linux網站
運維文件 - 伺服器效能監控系統
2024-07-27
運維伺服器

CentOS：作業系統級監控及常用計數器解析---除CPU以外

I/O

Memory

相關文章