共享記憶體段未釋放導致資料庫記憶體被耗盡
最近果然亂七八糟的事情比較多,剛剛重啟的RAC節點,其中一個節點記憶體佔用99%了。
glance看到的記憶體和程式排序佔用情況:
實際上oracle也沒佔用這麼多的記憶體啊。
1314*30m=40G
那其他的記憶體去哪裡了呢?
這個問題發生在RMAN問題處理之後,詳細的見:http://user.qzone.qq.com/8733223/blog/1323283285
聯想到當天晚上重啟的操作,其實在重啟的過程中,有報錯
Thu Dec 8 01:39:22 2011
Errors in file /oraclelog/ngact/bdump/ngact1_pmon_18234.trc:
ORA-00304: requested INSTANCE_NUMBER is busy
Thu Dec 8 01:39:22 2011
USER: terminating instance due to error 304
Instance terminated by USER, pid = 17422
重啟兩次都不成功。最終重啟了crs才成功。
當時沒想到無法重啟的原因,現在聯絡到一起,就可以發現了,估計出問題的歸檔程式還是沒殺掉,所以導致共享記憶體段也無法釋放,新的例項也起不來,檢查一下當時出問題的歸檔程式,果然還在
actdb1:/oracle>ps -ef | grep 1827
oracle 1827 1 0 Dec 5 ? 0:00 ora_arc1_ngact1
oracle 6473 15104 0 13:41:11 pts/tb 0:00 grep 1827
這1827已經成為一個殭屍程式了,無法kill掉了,只能等待機器重啟
actdb1:/oracle>kill -9 1827
actdb1:/oracle>ps -ef | grep ora_arc1
oracle 1827 1 0 Dec 5 ? 0:00 ora_arc1_ngact1
這臺機器的配置記憶體為128G
/oracle>machinfo
CPU info:
12 Intel(R) Itanium 2 9100 series processors (1.6 GHz, 24 MB)
533 MT/s bus, CPU version A1
24 logical processors (2 per socket)
/oracle>machinfo
CPU info:
12 Intel(R) Itanium 2 9100 series processors (1.6 GHz, 24 MB)
533 MT/s bus, CPU version A1
24 logical processors (2 per socket)
Memory: 130875 MB (127.81 GB)
Firmware info:
Firmware revision: 9.48
FP SWA driver revision: 1.18
IPMI is supported on this system.
BMC firmware revision: 26.03
Firmware revision: 9.48
FP SWA driver revision: 1.18
IPMI is supported on this system.
BMC firmware revision: 26.03
glance看到的記憶體和程式排序佔用情況:
實際上oracle也沒佔用這麼多的記憶體啊。
1314*30m=40G
那其他的記憶體去哪裡了呢?
ProcList CPU Rpt Mem Rpt Disk Rpt NextKeys SlctProc Help Exit
Glance C.04.70.001 12:35:26 actdb1 ia64 Current Avg High
------------------------------------------------------------------------------------------------------------------------------------
CPU Util S SR RU | 38% 44% 48%
Disk Util F F | 10% 12% 21%
Mem Util S SU U | 99% 99% 99%
Networkil U UR R | 95% 95% 95%
------------------------------------------------------------------------------------------------------------------------------------
PROCESS LIST Users= 3
User CPU % Thrd Disk Memory Block
Process Name PID Name (2400% max) Cnt IOrate RSS/VSS On
--------------------------------------------------------------------------------
midaemon 5130 root 11.8 14 0.0 519.0mb 523.2mb SLEEP
vxpal 3817 root 0.0 15 0.0 182.9mb 223.7mb SLEEP
oraclengact1 10805 oracle 3.5 1 0.0 125.0mb 138.5mb SOCKT
vxfsd 330 root 5.1 299 9.2 77.4mb 87.0mb OTHER
java 27769 oracle 0.0 22 0.0 70.5mb 312.1mb SLEEP
oraclengact1 22093 oracle 8.1 1 0.0 68.3mb 74.5mb SOCKT
cimprovagt 4277 root 0.0 34 0.0 57.7mb 131.2mb SLEEP
vxconfigd 742 root 0.0 1 0.0 53.2mb 99.8mb SLEEP
ocssd.bin 25219 oracle 0.6 20 5.8 50.7mb 50.7mb SLEEP
crsd.bin 24999 root 0.1 44 0.0 49.0mb 98.0mb SLEEP
vxpal 4470 root 0.0 47 0.0 43.6mb 149.0mb SLEEP
ora_arc1_nga 1827 root 0.0 1 0.0 40.7mb 43.5mb OTHER
ora_lms2_nga 27150 oracle 3.5 1 0.0 37.2mb 44.7mb SLEEP
ora_lms0_nga 27146 oracle 3.3 1 0.0 37.2mb 49.9mb SLEEP
ora_lms4_nga 27161 oracle 3.5 1 0.0 37.2mb 46.0mb SLEEP
ora_lms1_nga 27148 oracle 3.3 1 0.0 37.1mb 44.9mb SLEEP
ora_lms5_nga 27163 oracle 3.5 1 0.0 37.1mb 49.5mb SLEEP
ora_lmd0_nga 27144 oracle 0.1 1 0.0 36.7mb 403.3mb SLEEP
ora_arc1_nga 27445 oracle 0.0 1 2.6 35.2mb 54.5mb OTHER
oraclengact1 4556 oracle 0.0 1 0.0 34.1mb 34.1mb SOCKT
ora_arc0_nga 27443 oracle 0.0 1 0.0 34.0mb 50.8mb OTHER
ora_lms3_nga 27157 oracle 3.4 1 0.0 33.9mb 53.6mb SLEEP
ora_ckpt_nga 27190 oracle 0.3 1 6.2 32.7mb 45.8mb OTHER
ora_cjq0_nga 27203 oracle 0.0 1 0.0 31.7mb 468.6mb OTHER
oraclengact1 7650 oracle 0.0 1 0.0 31.3mb 38.6mb SOCKT
ora_lck0_nga 27293 oracle 0.0 1 0.0 29.9mb 35.3mb SLEEP
ora_dbw3_nga 27173 oracle 0.5 1 22.7 28.8mb 35.1mb OTHER
ora_dbw0_nga 27167 oracle 0.8 1 27.3 28.4mb 45.3mb OTHER
ora_dbw1_nga 27169 oracle 0.4 1 14.2 28.1mb 34.1mb OTHER
ora_dbw5_nga 27177 oracle 0.5 1 16.1 28.1mb 34.1mb OTHER
Glance C.04.70.001 12:35:26 actdb1 ia64 Current Avg High
------------------------------------------------------------------------------------------------------------------------------------
CPU Util S SR RU | 38% 44% 48%
Disk Util F F | 10% 12% 21%
Mem Util S SU U | 99% 99% 99%
Networkil U UR R | 95% 95% 95%
------------------------------------------------------------------------------------------------------------------------------------
PROCESS LIST Users= 3
User CPU % Thrd Disk Memory Block
Process Name PID Name (2400% max) Cnt IOrate RSS/VSS On
--------------------------------------------------------------------------------
midaemon 5130 root 11.8 14 0.0 519.0mb 523.2mb SLEEP
vxpal 3817 root 0.0 15 0.0 182.9mb 223.7mb SLEEP
oraclengact1 10805 oracle 3.5 1 0.0 125.0mb 138.5mb SOCKT
vxfsd 330 root 5.1 299 9.2 77.4mb 87.0mb OTHER
java 27769 oracle 0.0 22 0.0 70.5mb 312.1mb SLEEP
oraclengact1 22093 oracle 8.1 1 0.0 68.3mb 74.5mb SOCKT
cimprovagt 4277 root 0.0 34 0.0 57.7mb 131.2mb SLEEP
vxconfigd 742 root 0.0 1 0.0 53.2mb 99.8mb SLEEP
ocssd.bin 25219 oracle 0.6 20 5.8 50.7mb 50.7mb SLEEP
crsd.bin 24999 root 0.1 44 0.0 49.0mb 98.0mb SLEEP
vxpal 4470 root 0.0 47 0.0 43.6mb 149.0mb SLEEP
ora_arc1_nga 1827 root 0.0 1 0.0 40.7mb 43.5mb OTHER
ora_lms2_nga 27150 oracle 3.5 1 0.0 37.2mb 44.7mb SLEEP
ora_lms0_nga 27146 oracle 3.3 1 0.0 37.2mb 49.9mb SLEEP
ora_lms4_nga 27161 oracle 3.5 1 0.0 37.2mb 46.0mb SLEEP
ora_lms1_nga 27148 oracle 3.3 1 0.0 37.1mb 44.9mb SLEEP
ora_lms5_nga 27163 oracle 3.5 1 0.0 37.1mb 49.5mb SLEEP
ora_lmd0_nga 27144 oracle 0.1 1 0.0 36.7mb 403.3mb SLEEP
ora_arc1_nga 27445 oracle 0.0 1 2.6 35.2mb 54.5mb OTHER
oraclengact1 4556 oracle 0.0 1 0.0 34.1mb 34.1mb SOCKT
ora_arc0_nga 27443 oracle 0.0 1 0.0 34.0mb 50.8mb OTHER
ora_lms3_nga 27157 oracle 3.4 1 0.0 33.9mb 53.6mb SLEEP
ora_ckpt_nga 27190 oracle 0.3 1 6.2 32.7mb 45.8mb OTHER
ora_cjq0_nga 27203 oracle 0.0 1 0.0 31.7mb 468.6mb OTHER
oraclengact1 7650 oracle 0.0 1 0.0 31.3mb 38.6mb SOCKT
ora_lck0_nga 27293 oracle 0.0 1 0.0 29.9mb 35.3mb SLEEP
ora_dbw3_nga 27173 oracle 0.5 1 22.7 28.8mb 35.1mb OTHER
ora_dbw0_nga 27167 oracle 0.8 1 27.3 28.4mb 45.3mb OTHER
ora_dbw1_nga 27169 oracle 0.4 1 14.2 28.1mb 34.1mb OTHER
ora_dbw5_nga 27177 oracle 0.5 1 16.1 28.1mb 34.1mb OTHER
/oracle>ps -ef|grep oracle |wc -l
1314
1314
終於同事在共享記憶體段裡面發現了問題:
原來有一段空間沒有釋放回收,而這個共享段的建立程式29637和最後的訪問程式9644都已經不在了
actdb1:/oracle>ipcs -ma
IPC status from /dev/kmem as of Fri Dec 9 12:34:31 2011
T ID KEY MODE OWNER GROUP CREATOR CGROUP NATTCH SEGSZ CPID LPID ATIME DTIME CTIME
Shared Memory:
m 0 0x4118016b --rw-rw-rw- root root root root 0 348 2959 21281 13:29:18 13:29:18 21:12:25
m 1 0x4e0c0002 --rw-rw-rw- root root root root 3 61760 2959 10645 11:34:56 11:43:20 21:12:25
m 2 0x411c98fb --rw-rw-rw- root root root root 2 8192 2959 2961 13:30:49 13:29:18 21:12:25
m 3 0x0000cace --rw-rw-rw- root root root root 0 2 4100 4100 11:14:20 11:14:20 21:13:13
m 4 0x00a5c581 --rw------- sfmdb users sfmdb users 8 10469376 4165 4168 21:13:14 21:13:14 21:13:14
m 5 0x4118061f --rw------- root root root root 1 4096 4318 5732 21:15:48 no-entry 21:15:48
m 6488070 0x4d4e5251 --rw-r--r-- root sys root sys 2 330752 28899 5805 2:51:13 no-entry 0:35:30
m 32775 0x55315352 --rw-rw-rw- root sys root sys 1 4096 28899 22247 11:41:47 11:42:55 0:35:30
m 32776 0x44525354 --rw-r--r-- root sys root sys 3 638976 28899 19619 11:40:28 11:40:28 0:35:30
m 32777 0x53494152 --rw-r--r-- root sys root sys 1 1024 28899 28899 0:35:30 no-entry 0:35:30
m 32778 0x00005643 --rw-rw-rw- root sys root sys 1 1024 28915 28915 0:35:31 no-entry 0:35:31
m 32779 0x00005654 --rw-rw-rw- root sys root sys 1 1024 28915 28915 0:35:31 no-entry 0:35:31
m 131084 0x00000000 D-rw-rw---- oracle dba oracle dba 1 51556487168 29637 9644 1:33:29 1:33:29 1:33:29
m 13 0x06347849 --rw-rw-rw- root root root root 2 65544 5093 5099 21:15:20 21:15:16 21:15:15
m 14 0x0c6629c9 --rw-r----- root root root root 2 17911576 5104 604 10:37:15 10:54:24 21:15:16
m 15 0x4910ab8c --rw-r--r-- root root root root 0 22908 5142 5099 12:34:00 12:34:00 21:15:17
m 10223632 0x5077995c --rw-rw---- oracle dba oracle dba 2580 51556487168 26217 17977 12:34:31 12:34:31 1:44:21
原來有一段空間沒有釋放回收,而這個共享段的建立程式29637和最後的訪問程式9644都已經不在了
actdb1:/oracle>ipcs -ma
IPC status from /dev/kmem as of Fri Dec 9 12:34:31 2011
T ID KEY MODE OWNER GROUP CREATOR CGROUP NATTCH SEGSZ CPID LPID ATIME DTIME CTIME
Shared Memory:
m 0 0x4118016b --rw-rw-rw- root root root root 0 348 2959 21281 13:29:18 13:29:18 21:12:25
m 1 0x4e0c0002 --rw-rw-rw- root root root root 3 61760 2959 10645 11:34:56 11:43:20 21:12:25
m 2 0x411c98fb --rw-rw-rw- root root root root 2 8192 2959 2961 13:30:49 13:29:18 21:12:25
m 3 0x0000cace --rw-rw-rw- root root root root 0 2 4100 4100 11:14:20 11:14:20 21:13:13
m 4 0x00a5c581 --rw------- sfmdb users sfmdb users 8 10469376 4165 4168 21:13:14 21:13:14 21:13:14
m 5 0x4118061f --rw------- root root root root 1 4096 4318 5732 21:15:48 no-entry 21:15:48
m 6488070 0x4d4e5251 --rw-r--r-- root sys root sys 2 330752 28899 5805 2:51:13 no-entry 0:35:30
m 32775 0x55315352 --rw-rw-rw- root sys root sys 1 4096 28899 22247 11:41:47 11:42:55 0:35:30
m 32776 0x44525354 --rw-r--r-- root sys root sys 3 638976 28899 19619 11:40:28 11:40:28 0:35:30
m 32777 0x53494152 --rw-r--r-- root sys root sys 1 1024 28899 28899 0:35:30 no-entry 0:35:30
m 32778 0x00005643 --rw-rw-rw- root sys root sys 1 1024 28915 28915 0:35:31 no-entry 0:35:31
m 32779 0x00005654 --rw-rw-rw- root sys root sys 1 1024 28915 28915 0:35:31 no-entry 0:35:31
m 131084 0x00000000 D-rw-rw---- oracle dba oracle dba 1 51556487168 29637 9644 1:33:29 1:33:29 1:33:29
m 13 0x06347849 --rw-rw-rw- root root root root 2 65544 5093 5099 21:15:20 21:15:16 21:15:15
m 14 0x0c6629c9 --rw-r----- root root root root 2 17911576 5104 604 10:37:15 10:54:24 21:15:16
m 15 0x4910ab8c --rw-r--r-- root root root root 0 22908 5142 5099 12:34:00 12:34:00 21:15:17
m 10223632 0x5077995c --rw-rw---- oracle dba oracle dba 2580 51556487168 26217 17977 12:34:31 12:34:31 1:44:21
actdb1:/oracle>ps -ef | grep 29637
oracle 8172 15104 1 13:42:21 pts/tb 0:00 grep 29637
actdb1:/oracle>ps -ef | grep 9644
oracle 5268 15104 0 13:40:24 pts/tb 0:00 grep 9644
oracle 8172 15104 1 13:42:21 pts/tb 0:00 grep 29637
actdb1:/oracle>ps -ef | grep 9644
oracle 5268 15104 0 13:40:24 pts/tb 0:00 grep 9644
這個問題發生在RMAN問題處理之後,詳細的見:http://user.qzone.qq.com/8733223/blog/1323283285
聯想到當天晚上重啟的操作,其實在重啟的過程中,有報錯
Thu Dec 8 01:39:22 2011
Errors in file /oraclelog/ngact/bdump/ngact1_pmon_18234.trc:
ORA-00304: requested INSTANCE_NUMBER is busy
Thu Dec 8 01:39:22 2011
USER: terminating instance due to error 304
Instance terminated by USER, pid = 17422
重啟兩次都不成功。最終重啟了crs才成功。
當時沒想到無法重啟的原因,現在聯絡到一起,就可以發現了,估計出問題的歸檔程式還是沒殺掉,所以導致共享記憶體段也無法釋放,新的例項也起不來,檢查一下當時出問題的歸檔程式,果然還在
actdb1:/oracle>ps -ef | grep 1827
oracle 1827 1 0 Dec 5 ? 0:00 ora_arc1_ngact1
oracle 6473 15104 0 13:41:11 pts/tb 0:00 grep 1827
這1827已經成為一個殭屍程式了,無法kill掉了,只能等待機器重啟
actdb1:/oracle>kill -9 1827
actdb1:/oracle>ps -ef | grep ora_arc1
oracle 1827 1 0 Dec 5 ? 0:00 ora_arc1_ngact1
最近出問題比較多,也不敢用ipcrm直接清理共享記憶體段,只能安排一次維護重啟來解決這個問題了。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/10867315/viewspace-713370/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 避免PHP-FPM記憶體洩漏導致記憶體耗盡PHP記憶體
- Linux釋放記憶體及手動釋放Oracle共享記憶體段Linux記憶體Oracle
- 耗盡實體記憶體觀查swap記憶體
- 利用ipcrm清除資料庫crash後沒有釋放的記憶體段資料庫記憶體
- 記憶體的分配與釋放,記憶體洩漏記憶體
- aix 共享記憶體段大小限制AI記憶體
- linux共享記憶體段研究Linux記憶體
- aix 共享記憶體段問題AI記憶體
- vector 的記憶體釋放記憶體
- XCode釋放記憶體XCode記憶體
- linux釋放記憶體Linux記憶體
- 記憶體資料庫記憶體資料庫
- 共享記憶體記憶體
- vector 避免記憶體頻繁分配釋放與手動釋放vector記憶體記憶體
- 資料庫實現原理#6(共享記憶體)資料庫記憶體
- Linux下php-fpm程式過多導致記憶體耗盡問題解決LinuxPHP記憶體
- kswapd 耗盡系統記憶體 kscand 耗盡系統cpu的解決記憶體
- 記憶體耗盡後Redis會發生什麼記憶體Redis
- 解決 SQL Server 耗盡記憶體的情況SQLServer記憶體
- 記憶體資料庫如何發揮記憶體優勢?記憶體資料庫
- 轉 linux 記憶體釋放Linux記憶體
- Linux釋放cache記憶體Linux記憶體
- linux 記憶體釋放命令Linux記憶體
- Mongodb記憶體資料庫MongoDB記憶體資料庫
- Golang 共享記憶體Golang記憶體
- POSIX共享記憶體記憶體
- oracle 共享記憶體Oracle記憶體
- POSIX 共享記憶體記憶體
- 自動共享記憶體管理 自動記憶體管理 手工記憶體管理記憶體
- 【大頁記憶體】Oracle資料庫配置大頁記憶體記憶體Oracle資料庫
- C# 垃圾回收釋放記憶體C#記憶體
- 正確釋放Vector的記憶體記憶體
- FireFox記憶體自動釋放Firefox記憶體
- 處理大型資料集而不會耗盡記憶體的方式推薦記憶體
- PHP大量資料迴圈時記憶體耗盡問題的解決方案PHP記憶體
- 【記憶體資料庫】TimesTen記憶體資料庫
- 故障分析 | MySQL 耗盡主機記憶體一例分析MySql記憶體
- nginx共享記憶體分析Nginx記憶體