看了這篇還不會Linux效能分析和優化,你來打我

程式設計師養成日記發表於2021-05-06

前言

一般網際網路的專案都是部署在linux伺服器上的,如果linux伺服器出了問題,那麼我們們平時學習的高併發,穩定性之類的是沒有任何意義的,所以對linux效能的把握就顯得非常重要,當然很多同學可能覺得這些是運維同學的事情,但是我不這麼認為,不管你是架構師,還是crud boy,對專案有個全域性的掌控是一項非常重要的基本素質,所以總結了這篇文章,希望對您有用,如果您覺得我寫的還不錯,看完記得點個贊,點個再看哦。我們們廢話不用多說,直接進入正題。

影響linux伺服器效能的因素

cpu

CPU是作業系統穩定執行的根本,CPU的速度與效能在很大程度上決定了系統整體的效能,因此,CPU數量越多、主頻越高,伺服器效能也就相對越好。

記憶體

記憶體的大小也是影響Linux效能的一個重要的因素,記憶體太小,系統程式將被阻塞,應用也將變得緩慢,甚至失去響應;記憶體太大,導致資源浪費。

磁碟IO

磁碟的I/O效能直接影響應用程式的效能,在一個有頻繁讀寫的應用中,如果磁碟I/O效能得不到滿足,就會導致應用停滯。好在現今的磁碟都採用了很多方法來提高I/O效能,比如常見的磁碟RAID技術。

網路

Linux下的各種應用,一般都是基於網路的,因此網路頻寬也是影響效能的一個重要因素,低速的、不穩定的網路將導致網路應用程式的訪問阻塞,而穩定、高速的網路頻寬,可以保證應用程式在網路上暢通無阻地執行。幸運的是,現在的網路一般都是千兆頻寬或光纖網路,頻寬問題對應用程式效能造成的影響也在逐步降低。

常用的linux系統效能監控的命令

uptime(系統整體效能評估)

這裡需要注意的是:load average這個輸出值,這三個值的大小一般不能大於系統CPU的個數

那麼如何檢視cpu的個數呢?

檢視系統cpu的資訊

cat /proc/cpuinfo中的資訊

其中cpu cores即為cpu的核數

也可以用cat /proc/cpuinfo |grep "cores"|uniq直接檢視

[root@test ~]# cat /proc/cpuinfo |grep "cores"|uniq
cpu cores : 2

cpu的效能評估

利用vmstat命令監控cpu

vmstat 2 10 (每2秒監控一次 監控10次)

procs

r表示執行和等待cpu時間片的程式數,這個值如果長期大於cpu的個數,則需要增加系統cpu

b表示等待資源的程式數

CPU

us列顯示了使用者程式消耗CPU時間百分比,us比較高的時候,說明使用者程式消耗cpu的時間多,如果長期大於50%,就需要優化程式和演算法

sy列顯示了核心程式消耗的cpu時間百分比,sy值較高的時候,說明核心消耗的cpu資源很多

根據經驗,us+sy的參考值為80%,如果us+sy大於 80%說明可能存在CPU資源不足。

利用sar命令監控系統cpu

sar命令會增加系統開銷 但是影響不大

yum install sysstat安裝sar命令

sar -u 3 5(u顯示系統所有cpu在取樣時間內的負載狀態) %user:使用者程式消耗cpu的時間百分比

%nice:執行正常程式所消耗cpu的百分比

%system:系統消耗cpu時間百分比

%iowait:IO等待所佔用cpu時間百分比

%steal:記憶體在相對緊張的環境下pagein強制對不同頁面進行的steal操作

%idle:cpu處在空閒時間的百分比

記憶體效能評估

利用free指令監控記憶體

free -m #檢視以M為單位的記憶體使用情況 一般有這樣一個經驗公式:

應用程式可用記憶體/系統實體記憶體>70%時,表示系統記憶體資源非常充足,不影響系統效能。

應用程式可用記憶體/系統實體記憶體<20%時,表示系統記憶體資源緊缺,需要增加系統記憶體。

20%<應用程式可用記憶體/系統實體記憶體<70%時,表示系統記憶體資源基本能滿足應用需求,暫時不影響系統效能。

利用vmstat監控記憶體

swpd表示切換到記憶體交換去的記憶體數量(k),如果swpd的值不為0,或者比較大,但是si,so的值長期為0,這種情況不用擔心,不會影響效能

free表示空閒的實體記憶體數量

buffer表示buffers cache的記憶體數量,一般對裝置的讀寫才需要緩衝

cache表示page cached的記憶體數量。一般作為檔案系統cached,頻繁訪問的檔案都會被cached,如果cache值較大,說明cached的檔案較多,如果此時IO中的bi比較小,說明檔案系統效率比較好

si表示由磁碟調入記憶體,也就是記憶體進入記憶體交換區的數量

so表示由記憶體調入磁碟,也就是記憶體交換區進入記憶體的數量 一般情況下,so si的值都為0。如果si so的值長期不為0,則表示系統記憶體不足,需要增加記憶體

磁碟IO效能評估

iostat

iostat -d 2 10

Blk_reads/s  每秒讀取的資料塊數

Blk_wrtn/s   每秒寫入的資料塊數

Blk_read     讀取的所有塊數

Blk_wrtn     寫入的所有塊數

這幾個值沒有標準 如果長期都很大 肯定是不正常的

利用sar評估磁碟效能

sar -d 2 5 await 平均每次裝置I/O操作的等待時間(毫秒)

svctm 平均每次裝置I/O操作的服務時間(毫秒)

%util 一秒中有百分之幾的時間用於I/O操作

評判標準

正常情況下svctm應該是小於await的,svctm的值和磁碟效能,cpu記憶體等都有關係

如果svctm的值和await的值相近表示幾乎沒有I/O等待,磁碟效能很好,如果await的值遠高於svctm,表示I/O佇列等待時間太長,系統上的應用程式將變慢,此時可以通過更換更快的硬碟來解決問題

%util越小越好,如果%util接近100%表示磁碟產生的I/O請求太多,I/O系統已經滿負載在工作,此時可以通過優化程式或者更換更快的磁碟來解決問題

網路效能評估

通過ping命令檢測網路的連通性。
通過netstat -i 組合檢測網路介面狀況。
通過netstat -r 組合檢測系統路由表資訊。
通過sar -n 組合顯示系統的網路執行狀態(sar -n DEV 5 3)。

常用分析:

檢視tcp連線數最多的ip:

sudo netstat -pant | grep ":22" | awk '{print $5}' | awk -F":" '{print $4}' |sort|uniq -c|sort -nr

解釋:

awk -F":" '{print $4}' 表示把結果的第4列用:號分割

sort -nr 排序,-n以數值大小排序,-r倒序,從大到小。

uniq -c 刪除重複的行,-c表示加上每行出現的次數。

netstat命令是一個監控TCP/IP網路的非常有用的工具, 它可以顯示路由表、實際的網路連線以及每一個網路介面裝置的狀態資訊。

netstat -pant

引數-p :顯示正在使用Socket的程式識別碼和程式名稱;

引數-a :顯示所有連線中的Socket;

引數-n :直接使用ip地址,而不通過域名伺服器;

引數-t :顯示TCP傳輸協議的連線狀況。

提取訪問nginx伺服器最多的10個ip。

cat access.log | awk '{print $1}' | sort | uniq -c | sort -nr | head -n10

相關文章