Linux 下判斷Server 記憶體是否不足

ysping發表於2009-08-05

一個客戶近段時間一直讓我檢查他們Oracle Server 記憶體是否需要吃緊。
因為他一直使用linux 的Top 命令來看系統執行狀況的。


下面我來寫一下在linux OS 下如何判斷系統是否記憶體吃緊。

我從兩個部分來檢視如何檢查。

[@more@]

第一部分:檢視記憶體使用狀況

Linux 下使用Top

[root@itc-test9 ~]# top
top - 17:08:01 up 12 days,3:48,2 users,load average: 0.01, 0.01, 0.00
Tasks:95 total, 1 running,94 sleeping, 0 stopped, 0 zombie
Cpu(s):0.0% us,0.0% sy,0.0% ni, 99.5% id,0.5% wa,0.0% hi,0.0% si
Mem: 2056000k total,1963652k used, 92348k free, 59156k buffers
Swap:4096564k total, 164k used,4096400k free,1605276k cached

PID USER PRNIVIRTRESSHR S %CPU %MEM TIME+COMMAND
1 root 16 04744552460 S0.00.0 0:00.46 init

從Top 顯示來看是有1963652K已經使用,只有92348k 記憶體空閒。一直問我是否記憶體不足了。下面就來解釋一下Oracle 在Linux 下如何檢視OS 記憶體是否不足。


但我們從Linux command free 來看:

[oracle@itc-test9 ~]free
total used free shared buffers cached
Mem: 2056000 1869596 186404 0 59172 1512236
-/+ buffers/cache: 298188 1757812
Swap: 4096564 164 4096400


-/+ buffers/cache: used=298188k =291.2M
free=1757812k=1716.6M 約等於2G。

從Free 命令列來看OS 還有1.76G 空間未使用。

需要解釋一下Free 和Top 在Linux 下的不同顯示問題。

Free命令顯示在作業系統中使用和空閒的記憶體數量。
Top 顯示是和Linux 對記憶體使用的方式關係緊密,linux 儘可能的要求
使用實體記憶體來提高Buffer 和Cache 對Disk 的I/O操作。Linux 將盡可能多的將I/O 操作磁碟上的資訊儲存在記憶體當中,如果Oracle(其他程式也一樣)需要更多的記憶體空間,Linux 才會將一些記憶體使用LRU 演算法清理出來,如果不需要則繼續保持這些資料資訊在記憶體中。所以我們使用Top看到的Memory Free Mem: 2056000k total,1963652k used, 92348k free 很少。

free 命令顯示的Mem free 數量是系統直接可以使用的記憶體,沒有包括LRU 交換Pages

第二部分:檢視Swap 的狀況:

Swap 空間的使用狀況也能分辨出Oracle 伺服器記憶體是否已經吃緊。

先看Swap 大小設定:
RAM Size Swap Size
1-2G 1.5 倍 RAM
2-8G 1 倍 RAM
>8G 0.75 RAM

基本上每個操做系統(除Windows)都建議Swap 使用上面比例的配置。
但根據個人經驗如果Server 的Memory >32G 時,一般都會將Swap 空間設定在10g 以內,甚至更小。

使用Command more /proc/meminfo 或top 來Monitor Swap 的使用狀況。

[root@itc-test9 ~]# more /proc/meminfo
MemTotal: 2056000 kB
MemFree: 177268 kB
Buffers: 59292 kB
Cached: 1519188 kB
SwapCached: 4 kB
Active: 1092248 kB
Inactive: 654096 kB
HighTotal: 0 kB
HighFree: 0 kB
LowTotal: 2056000 kB
LowFree: 177268 kB
SwapTotal: 4096564 kB
SwapFree: 4096400 kB

[root@itc-test9 ~]# top
top - 17:08:01 up 12 days,3:48,2 users,load average: 0.01, 0.01, 0.00
Tasks:95 total, 1 running,94 sleeping, 0 stopped, 0 zombie
Cpu(s):0.0% us,0.0% sy,0.0% ni, 99.5% id,0.5% wa,0.0% hi,0.0% si
Mem: 2056000k total,1963652k used, 92348k free, 59156k buffers
Swap:4096564k total, 164k used,4096400k free,1605276k cached

如果你觀察Swap 中的使用量一直在增加,或Swap used 為一個很大的值。那我們基本就能確定在現有的狀況下Oracle server 記憶體出現問題。(我們需要考慮此現象是偶爾發生還是一直出現)
我們需要做:
增加記憶體
減少OS 程式使用記憶體資源,如Oracle 減少SGA_target 或Memory_Target(11g)
增大交換空間

你可以透過vmstat 來看當前Swap 活動的狀態。
Swap 下面的Si 和So 分別顯示Swap 頁面交換進來和交換出去。

[root@itc-test9 ~]# vmstat 3 8
procs -----------memory---------- ---swap-- -----io---- --system-- ----cpu----
rb swpd free buffcache si so bi bo in cs us sy id wa
00 164 17546859292 1520344 0 0 1 21 4 2000 990
00 164 17553259292 1520344 0 0 0 48 1038 4100 1000
00 164 17553259292 1520344 0 0 0 61 1032 3500 990
00 164 17553259292 1520344 0 0 0 11 1028 3900 1000
00 164 17553259292 1520344 0 0 0 15 1024 3900 1000

使用Vmstat 命令只能看當前的Swap 頁面的交換入和交換出。那如何看歷史Swap 資訊呢。

Linux 下有一個命令可以看,那就是


[root@itc-test9 sa]# cd /var/log/sa
[root@itc-test9 sa]# ls -al |grep 13
drwxr-xr-x 2 root root 4096 Apr 13 00:00 .
-rw-r--r-- 1 root root 209328 Apr 13 17:50 sa13

[root@itc-test9 sa]# date ----今天是4/13 號
Mon Apr 13 17:58:02 CST 2009

[root@itc-test9 sa]# ll |grep 13
-rw-r--r--1 root root 209328 Apr 13 17:50 sa13

[root@itc-test9 sa]# sar -W -f sa13
Linux 2.6.9-5.ELsmp (itc-test9) 04/13/2009

12:00:01 AMpswpin/s pswpout/s
12:10:01 AM 0.00 0.00
12:20:01 AM 0.00 0.00
12:30:01 AM 0.00 0.00
12:40:01 AM 0.00 0.00
12:50:01 AM 0.00 0.00
01:00:01 AM 0.00 0.00
01:10:01 AM 0.00 0.00
01:20:01 AM 0.00 0.00
......(中間略去)
...... (中間略去)
03:50:01 PM 0.00 0.00
04:00:01 PM 0.00 0.00
04:10:01 PM 0.00 0.00
04:20:01 PM 0.00 0.00
04:30:01 PM 0.00 0.00
04:40:01 PM 0.00 0.00
04:50:01 PM 0.00 0.00
05:00:01 PM 0.00 0.00
05:10:01 PM 0.00 0.00
05:20:01 PM 0.00 0.00
05:30:01 PM 0.00 0.00
05:40:01 PM 0.00 0.00
05:50:01 PM 0.00 0.00
Average: 0.00 0.00

顯示從今天0點到當前的所有Swap 頁面交換的數量


第三、free輸出的解釋

[root@Linux /tmp]# free
total used free shared buffers cached
Mem: 4149156 4130412 18744 0 13220 2720160
-/+ buffers/cache: 1397032 2752124
Swap: 6289408 144 6289264第1行
total 記憶體總數: 4149156
used 已經使用的記憶體數: 4130412
free 空閒的記憶體數: 18744
shared 當前已經廢棄不用,總是0
buffers Buffer Cache記憶體數: 13220
cached Page Cache記憶體數: 2720160

關係:total = used + free

第2行:
-/+ buffers/cache的意思相當於:
-buffers/cache 的記憶體數:1397032 (等於第1行的 used - buffers - cached)
+buffers/cache 的記憶體數: 2752124 (等於第1行的 free + buffers + cached)

可見-buffers/cache反映的是被程式實實在在吃掉的記憶體,而+buffers/cache反映的是可以挪用的記憶體總數。

第三行單獨針對交換分割槽, 就不用再說了.

為了提高磁碟存取效率, Linux做了一些精心的設計, 除了對dentry進行快取(用於VFS,加速檔案路徑名到inode的轉換), 還採取了兩種主要Cache方式:Buffer Cache和Page Cache。前者針對磁碟塊的讀寫,後者針對檔案inode的讀寫。這些Cache有效縮短了 I/O系統呼叫(比如read,write,getdents)的時間。

如果感興趣可以進一步參考檔案/proc/meminfo,free命令就是根據它的資訊生成的。free命令的原始碼可從procps-xxx-.src.rpm獲取,xxx為版本號,比如procps-3.2.3-5.3.src.rpm。

參考核心程式碼:

arch/i386/mm/init.c
fs/proc/proc_misc.c
include/linux/swap.h
mm/filemap.c
fs/buffer.c

另外還可以參考O'REILLY的書《Understanding the LINUX KERNEL》。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/670493/viewspace-1024920/,如需轉載,請註明出處,否則將追究法律責任。

相關文章