Linux系統的平均負載

gaopengtttt發表於2010-06-09

轉自網路

不錯的一篇文章,收藏了

 

關於Linux系統的平均負載最全面介紹
一、什麼是系統平均負載(Load average)?
在Linux系統中,uptime、w、top等命令都會有系統平均負載load average的輸出,那麼什麼是系統平均負載呢?
系統平均負載被定義為在特定時間間隔內執行佇列中的平均程式數。如果一個程式滿足以下條件則其就會位於執行佇列中:
- 它沒有在等待I/O操作的結果
- 它沒有主動進入等待狀態(也就是沒有呼叫'wait')
- 沒有被停止(例如:等待終止)
例如:
[root@opendigest root]# uptime
7:51pm up 2 days, 5:43, 2 users, load average: 8.13, 5.90, 4.94
命令輸出的最後內容表示在過去的1、5、15分鐘內執行佇列中的平均程式數量。
一般來說只要每個CPU的當前活動程式數不大於3那麼系統的效能就是良好的,如果每個CPU的任務數大於5,那麼就表示這臺機器的效能有嚴重問題。對於上面的例子來說,假設系統有兩個CPU,那麼其每個CPU的當前任務數為:8.13/2=4.065。這表示該系統的效能是可以接受的。

二、Load average的演算法
上面的輸出資料是每隔5秒鐘檢查一次活躍的程式數,然後根據這個數值算出來的。如果這個數除以CPU的數目,結果高於5的時候就表明系統在超負荷運轉了。其演算法(摘自Linux 2.4的核心程式碼)如下:

檔案: include/linux/sched.h:
#define FSHIFT 11 /* nr of bits of precision */
#define FIXED_1 (1LOAD_FREQ (5*HZ) /* 5 sec intervals */
#define EXP_1 1884 /* 1/exp(5sec/1min) as fixed-point, 2048/pow(exp(1), 5.0/60) */
#define EXP_5 2014 /* 1/exp(5sec/5min), 2048/pow(exp(1), 5.0/300) */
#define EXP_15 2037 /* 1/exp(5sec/15min), 2048/pow(exp(1), 5.0/900) */

#define CALC_LOAD(load,exp,n) \
load *= exp; \
load += n*(FIXED_1-exp); \
load >>= FSHIFT;

/**********************************************************/

檔案: kernel/timer.c:
unsigned long avenrun[3];

static inline void calc_load(unsigned long ticks)
{
unsigned long active_tasks; /* fixed-point */
static int count = LOAD_FREQ;

count -= ticks;
if (count < 0) {
count += LOAD_FREQ;
active_tasks = count_active_tasks();
CALC_LOAD(avenrun[0], EXP_1, active_tasks);
CALC_LOAD(avenrun[1], EXP_5, active_tasks);
CALC_LOAD(avenrun[2], EXP_15, active_tasks);
}
}

/**********************************************************/

檔案: fs/proc/proc_misc.c:

#define LOAD_INT(x) ((x) >> FSHIFT)
#define LOAD_FRAC(x) LOAD_INT(((x) & (FIXED_1-1)) * 100)

static int loadavg_read_proc(char *page, char **start, off_t off,
int count, int *eof, void *data)
{
int a, b, c;
int len;

a = avenrun[0] + (FIXED_1/200);
b = avenrun[1] + (FIXED_1/200);
c = avenrun[2] + (FIXED_1/200);
len = sprintf(page,"%d.%02d %d.%02d %d.%02d %ld/%d %d\n",
LOAD_INT(a), LOAD_FRAC(a),
LOAD_INT(b), LOAD_FRAC(b),
LOAD_INT(c), LOAD_FRAC(c),
nr_running(), nr_threads, last_pid);
return proc_calc_metrics(page, start, off, count, eof, len);
}

三、/proc/loadavg 各項資料的含義
/proc檔案系統是一個虛擬的檔案系統,不佔用磁碟空間,它反映了當前作業系統在記憶體中的執行情況,檢視/proc下的檔案可以聊寄到系統的執行狀態。檢視系統平均負載使用“cat /proc/loadavg”命令,輸出結果如下:
0.27 0.36 0.37 4/83 4828/
前三個數字大家都知道,是1、5、15分鐘內的平均程式數(有人認為是系統負荷的百分比,其實不然,有些時候可以看到200甚至更多)。後面兩個呢,一個的分子是正在執行的程式數,分母是程式總數;另一個是最近執行的程式ID號。

四、檢視系統平均負載的常用命令
1、cat /proc/loadavg

2、uptime
名稱: uptime
使用許可權: 所有使用者
使用方式: uptime [-V]
說明: uptime 提供使用者下面的資訊,不需其他引數:
現在的時間 系統開機運轉到現在經過的時間 連線的使用者數量 最近一分鐘,五分鐘和十五分鐘的系統負載
引數: -V 顯示版本資訊。
範例: uptime
其結果為:
10:41am up 5 days, 10 min, 1 users, load average: 0.00, 0.00, 1.99


3、w

功能說明:顯示目前登入系統的使用者資訊。
語  法:w [-fhlsuV][使用者名稱稱]
補充說明:執行這項指令可得知目前登入系統的使用者有那些人,以及他們正在執行的程式。單獨執行w
指令會顯示所有的使用者,您也可指定使用者名稱稱,僅顯示某位使用者的相關資訊。
參  數:
-f  開啟或關閉顯示使用者從何處登入系統。
-h  不顯示各欄位的標題資訊列。
-l  使用詳細格式列表,此為預設值。
-s  使用簡潔格式列表,不顯示使用者登入時間,終端機階段作業和程式所耗費的CPU時間。
-u  忽略執行程式的名稱,以及該程式耗費CPU時間的資訊。
-V  顯示版本資訊。
4、top
功能說明:顯示,管理執行中的程式。
語  法:top [bciqsS][d ][n ]
補充說明:執行top指令可顯示目前正在系統中執行的程式,並透過它所提供的互動式介面,用熱鍵加以管理。
參  數:
b  使用批處理模式。
c  列出程式時,顯示每個程式的完整指令,包括指令名稱,路徑和引數等相關資訊。
d  設定top監控程式執行狀況的間隔時間,單位以秒計算。
i  執行top指令時,忽略閒置或是已成為Zombie的程式。
n  設定監控資訊的更新次數。
q  持續監控程式執行的狀況。
s  使用保密模式,消除互動模式下的潛在危機。
S  使用累計模式,其效果類似ps指令的"-S"引數。

5、tload
功能說明:顯示系統負載狀況。
語  法:tload [-V][-d ][-s ][終端機編號]
補充說明:tload指令使用ASCII字元簡單地以文字模式顯示系統負載狀態。假設不給予終端機編號,則會在執行tload指令的終端機顯示負載情形。
參  數:
-d  設定tload檢測系統負載的間隔時間,單位以秒計算。
-s  設定圖表的垂直刻度大小,單位以列計算。
-V  顯示版本資訊。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/7728585/viewspace-664790/,如需轉載,請註明出處,否則將追究法律責任。

相關文章