Linux CPU負載

Dus發表於2015-04-10

昨天檢視Nagios警報資訊，發現其中一臺伺服器CPU負載過重，機器為CentOS系統。資訊如下：

2011-2-15 (星期二) 17:50
WARNING - load average: 9.73, 10.67, 10.49

還有前兩個小時發出的警報資訊：

2011-2-15 (星期二) 16:50
WARNING - load average: 10.52, 10.10, 10.06

2011-2-15 (星期二) 15:40
WARNING - load average: 8.27, 9.23, 9.48

一、警報資訊的三個引數到底是什麼意思？

9.73、10.67、10.49分別代表前一分鐘，五分鐘，十五分鐘的平均CPU負載，最重要的指標是最後一個數字，即前15分鐘的平均CPU負載，這個數字越小越好。所謂CPU負載指的是一段時間內任務佇列的長度，通俗的講，就是一段時間內一共有多少任務在使用或等待使用CPU。

二、除了Nagios，還有哪些工具可以檢視CPU負載？

可以使用top命令、uptime命令，特別是top命令，功能強大，不僅僅可以用來檢視CPU負載。

三、CPU負載怎麼理解？是不是CPU利用率？

這裡要區別CPU負載和CPU利用率，它們是不同的兩個概念，但它們的資訊可以在同一個top命令中進行顯示。CPU利用率顯示的是程式在執行期間實時佔用的CPU百分比，而CPU負載顯示的是一段時間內正在使用和等待使用CPU的平均任務數。CPU利用率高，並不意味著負載就一定大。網上有篇文章舉了一個有趣比喻，拿打電話來說明兩者的區別，我按自己的理解闡述一下。

某公用電話亭，有一個人在打電話，四個人在等待，每人限定使用電話一分鐘，若有人一分鐘之內沒有打完電話，只能掛掉電話去排隊，等待下一輪。電話在這裡就相當於CPU，而正在或等待打電話的人就相當於任務數。

在電話亭使用過程中，肯定會有人打完電話走掉，有人沒有打完電話而選擇重新排隊，更會有新增的人在這兒排隊，這個人數的變化就相當於任務數的增減。為了統計平均負載情況，我們5秒鐘統計一次人數，並在第1、5、15分鐘的時候對統計情況取平均值，從而形成第1、5、15分鐘的平均負載。

有的人拿起電話就打，一直打完1分鐘，而有的人可能前三十秒在找電話號碼，或者在猶豫要不要打，後三十秒才真正在打電話。如果把電話看作CPU，人數看作任務，我們就說前一個人（任務）的CPU利用率高，後一個人（任務）的CPU利用率低。

當然， CPU並不會在前三十秒工作，後三十秒歇著，只是說，有的程式涉及到大量的計算，所以CPU利用率就高，而有的程式牽涉到計算的部分很少，CPU利用率自然就低。但無論CPU的利用率是高是低，跟後面有多少任務在排隊沒有必然關係。

四、瞭解了CPU負載的含義，我們如何來降低伺服器的CPU負載呢？

最簡單辦法的是更換效能更好的伺服器，不要想著僅僅提高CPU的效能，那沒有用，CPU要發揮出它最好的效能還需要其它軟硬體的配合。

在伺服器其它方面配置合理的情況下，CPU數量和CPU核心數（即核心數）都會影響到CPU負載，因為任務最終是要分配到CPU核心去處理的。兩塊CPU要比一塊CPU好，雙核要比單核好。

因此，我們需要記住，除去CPU效能上的差異，CPU負載是基於核心數來計算的！有一個說法，“有多少核心，即有多少負載”。

五、那麼，本文開頭的CPU負載分擔到每個CPU上的負載是多少呢？那就要看我這臺伺服器有一共有多少個核心了。

Linux裡有一個/proc目錄，存放的是當前執行系統的虛擬對映，其中有一個檔案為cpuinfo，這個檔案裡存放著CPU的資訊。我們可以直接開啟檢視，或者過濾關鍵字進行檢視，因為檔案內容比較多，所以一般我們需要過濾關鍵字。

/proc/cpuinfo檔案按邏輯CPU而非真實CPU分段落顯示資訊，每個邏輯CPU的資訊佔用一個段落，第一個邏輯CPU標識從0開始。我們首先要明白這一點，至於什麼是邏輯CPU，下面會提到。要理解該檔案中的CPU資訊，有幾個相關的概念要知道：

processor：邏輯CPU的標識

model name：真實CPU的型號資訊

physical id：真實CPU和標識

cpu cores：真實CPU的核心數

$>grep ‘model name’ /proc/cpuinfo |uniq
model name : Intel(R) Xeon(R) CPU E5320 @ 1.86GHz

$>grep ‘physical id’ /proc/cpuinfo |sort |uniq |wc -l
2

$>grep ‘cpu cores’ /proc/cpuinfo |uniq
2

可以看出，該伺服器CPU型號為Intel(R) Xeon(R) CPU E5320，雙CPU，每個CPU都是雙核，相當於伺服器有4個核心。

前面我們說CPU負載是基於CPU核心數計算的，那麼以前十五分鐘的平均負載數10.49為例，我們可以得出，這臺伺服器每個CPU的負載為5.245，再分配到核心上，每個核心的負載為2.6左右。

這個負載是否是合理的呢？那就要看理想CPU負載的標準是什麼樣子的了。

六、CPU負載為多少才算比較理想？

這個有爭議，各有各的說法，我個人比較贊同CPU負載小於等於0.7算是一種理想狀態。

不管某個CPU的效能有多好，1秒鐘能處理多少任務，我們可以認為它無關緊要，雖然事實並非如此。在評估CPU負載時，我們只以5秒鐘為單位為統計任務佇列長度。如果每隔5秒鐘統計的時候，發現任務佇列長度都是1，那麼CPU負載就為1。假如我們只有一個單核的CPU，負載一直為1，意味著沒有任務在排隊，還不錯。

上面提到的我那臺伺服器，是雙核又CPU，等於是有4個核心，每個核心的負載為1的話，總負載為4。這就是說，如果我那臺伺服器的CPU負載長期保持在4左右，還可以接受。但實際上CPU負載已經達到9以上了，所以就很麻煩了。

但是每個核心的負載為1，並不能算是一種理想狀態！這意味著我們的CPU一直很忙，不得清閒。網上有說理想的狀態是每個核心的負載為0.7左右，我比較贊同，0.7乘以核心數，得出伺服器理想的CPU負載，比如我這臺伺服器，負載在3.0以下就可以。

七、下面關於邏輯CPU的描述，全部來自網上：

現在的伺服器一般都使用了“超執行緒”（Hyper-Threading，簡稱HT）技術來提高CPU的效能。超執行緒技術是在一顆CPU同時執行多個程式而共同分享一顆CPU內的資源，理論上要像兩顆CPU一樣在同一時間執行兩個執行緒。

雖然採用超執行緒技術能同時執行兩個執行緒，但它並不象兩個真正的CPU那樣，每各CPU都具有獨立的資源。當兩個執行緒都同時需要某一個資源時，其中一個要暫時停止，並讓出資源，直到這些資源閒置後才能繼續。因此超執行緒的效能並不等於兩顆CPU的效能。

具有超執行緒技術的CPU還有一些其它方面的限制。

Linux程序排程器-CPU負載
2024-10-29
Linux負載
(譯)理解Linux系統的CPU負載均值
2019-02-21
Linux負載
zabbix修改LINUX的CPU負載監控問題
2018-10-22
Linux負載
PostgreSQL DBA(88) - Linux(CPU使用率 vs 平均負載)
2019-09-06
SQLLinux負載
cpu負載過高原因
2020-09-28
負載
cpu負載是什麼意思電腦cpu負載過高怎麼處理解決
2022-04-09
負載
MySQL案例05：CPU負載優化
2018-05-22
MySql負載優化
CPU使用率低負載高
2020-04-17
負載
Linux平均負載
2024-01-31
Linux負載
在Linux中，發現CPU負載過大，接下來怎麼辦？
2024-03-10
Linux負載
Linux 中的負載高低和 CPU 開銷並不完全對應
2023-01-11
Linux負載
Linux LVS 負載均衡
2019-07-30
Linux負載
nginx自定義負載均衡及根據cpu執行自定義負載均衡
2023-04-16
Nginx負載
Linux效能優化-平均負載
2021-08-18
Linux優化負載
java檢測當前CPU負載狀態的方法
2024-06-04
Java負載
Linux 如何檢視系統負載
2019-07-26
Linux負載
java 7中新增的CPU和負載的監控
2018-08-27
Java負載
CPU 使用率低高負載的原因，看看這篇！
2019-09-22
負載
在Linux中，如何實現負載均衡？
2024-04-07
Linux負載
Linux環境下Nginx及負載均衡
2019-05-15
LinuxNginx負載
Shell----監控CPU/記憶體/負載高時的程式
2020-12-19
記憶體負載
Linux中LVS負載和Nginx負載區別是什麼？優劣勢彙總！
2022-08-16
Linux負載Nginx
利用 Arthas 精準定位 Java 應用 CPU 負載過高問題
2020-06-11
Java負載
再一次生產 CPU 高負載排查實踐
2019-06-18
負載
vmstat檢視分析Linux系統負載效能
2022-05-02
Linux負載
[轉帖]CPU效能原理篇：什麼是負載，應該如何排查
2024-05-21
負載
故障分析 | 大量短時程式導致 cpu 負載過高案例一則
2022-05-31
負載
Linux基礎命令---tload顯示系統負載
2019-04-10
Linux負載
linux實現DNS輪詢實現負載平衡
2020-08-04
LinuxDNS負載
gRPC負載均衡（自定義負載均衡策略）
2020-05-20
RPC負載
gRPC負載均衡（客戶端負載均衡）
2020-05-18
RPC負載客戶端
Understanding Linux CPU stats
2018-07-19
Linux
Linux 中模擬多種系統負載的方法
2019-01-23
Linux負載
Linux環境搭建Nginx+Tomcat負載均衡叢集
2018-12-23
LinuxNginxTomcat負載
如何解決linux系統平均負載高（load average）
2022-05-09
Linux負載
負載均衡
2024-05-05
負載
在 Linux 上用 DNS 實現簡單的負載均衡
2018-06-24
LinuxDNS負載
在Linux中，什麼是負載均衡？它是如何工作的？
2024-04-01
Linux負載
Linux下玩轉nginx系列（五）---nginx實現負載均衡
2022-05-17
LinuxNginx負載

Linux CPU負載

相關文章