共享記憶體段未釋放導致資料庫記憶體被耗盡
最近果然亂七八糟的事情比較多,剛剛重啟的RAC節點,其中一個節點記憶體佔用99%了。
glance看到的記憶體和程式排序佔用情況:
實際上oracle也沒佔用這麼多的記憶體啊。
1314*30m=40G
那其他的記憶體去哪裡了呢?
這個問題發生在RMAN問題處理之後,詳細的見:http://user.qzone.qq.com/8733223/blog/1323283285
聯想到當天晚上重啟的操作,其實在重啟的過程中,有報錯
Thu Dec 8 01:39:22 2011
Errors in file /oraclelog/ngact/bdump/ngact1_pmon_18234.trc:
ORA-00304: requested INSTANCE_NUMBER is busy
Thu Dec 8 01:39:22 2011
USER: terminating instance due to error 304
Instance terminated by USER, pid = 17422
重啟兩次都不成功。最終重啟了crs才成功。
當時沒想到無法重啟的原因,現在聯絡到一起,就可以發現了,估計出問題的歸檔程式還是沒殺掉,所以導致共享記憶體段也無法釋放,新的例項也起不來,檢查一下當時出問題的歸檔程式,果然還在
actdb1:/oracle>ps -ef | grep 1827
oracle 1827 1 0 Dec 5 ? 0:00 ora_arc1_ngact1
oracle 6473 15104 0 13:41:11 pts/tb 0:00 grep 1827
這1827已經成為一個殭屍程式了,無法kill掉了,只能等待機器重啟
actdb1:/oracle>kill -9 1827
actdb1:/oracle>ps -ef | grep ora_arc1
oracle 1827 1 0 Dec 5 ? 0:00 ora_arc1_ngact1
這臺機器的配置記憶體為128G
/oracle>machinfo
CPU info:
12 Intel(R) Itanium 2 9100 series processors (1.6 GHz, 24 MB)
533 MT/s bus, CPU version A1
24 logical processors (2 per socket)
/oracle>machinfo
CPU info:
12 Intel(R) Itanium 2 9100 series processors (1.6 GHz, 24 MB)
533 MT/s bus, CPU version A1
24 logical processors (2 per socket)
Memory: 130875 MB (127.81 GB)
Firmware info:
Firmware revision: 9.48
FP SWA driver revision: 1.18
IPMI is supported on this system.
BMC firmware revision: 26.03
Firmware revision: 9.48
FP SWA driver revision: 1.18
IPMI is supported on this system.
BMC firmware revision: 26.03
glance看到的記憶體和程式排序佔用情況:
實際上oracle也沒佔用這麼多的記憶體啊。
1314*30m=40G
那其他的記憶體去哪裡了呢?
ProcList CPU Rpt Mem Rpt Disk Rpt NextKeys SlctProc Help Exit
Glance C.04.70.001 12:35:26 actdb1 ia64 Current Avg High
------------------------------------------------------------------------------------------------------------------------------------
CPU Util S SR RU | 38% 44% 48%
Disk Util F F | 10% 12% 21%
Mem Util S SU U | 99% 99% 99%
Networkil U UR R | 95% 95% 95%
------------------------------------------------------------------------------------------------------------------------------------
PROCESS LIST Users= 3
User CPU % Thrd Disk Memory Block
Process Name PID Name (2400% max) Cnt IOrate RSS/VSS On
--------------------------------------------------------------------------------
midaemon 5130 root 11.8 14 0.0 519.0mb 523.2mb SLEEP
vxpal 3817 root 0.0 15 0.0 182.9mb 223.7mb SLEEP
oraclengact1 10805 oracle 3.5 1 0.0 125.0mb 138.5mb SOCKT
vxfsd 330 root 5.1 299 9.2 77.4mb 87.0mb OTHER
java 27769 oracle 0.0 22 0.0 70.5mb 312.1mb SLEEP
oraclengact1 22093 oracle 8.1 1 0.0 68.3mb 74.5mb SOCKT
cimprovagt 4277 root 0.0 34 0.0 57.7mb 131.2mb SLEEP
vxconfigd 742 root 0.0 1 0.0 53.2mb 99.8mb SLEEP
ocssd.bin 25219 oracle 0.6 20 5.8 50.7mb 50.7mb SLEEP
crsd.bin 24999 root 0.1 44 0.0 49.0mb 98.0mb SLEEP
vxpal 4470 root 0.0 47 0.0 43.6mb 149.0mb SLEEP
ora_arc1_nga 1827 root 0.0 1 0.0 40.7mb 43.5mb OTHER
ora_lms2_nga 27150 oracle 3.5 1 0.0 37.2mb 44.7mb SLEEP
ora_lms0_nga 27146 oracle 3.3 1 0.0 37.2mb 49.9mb SLEEP
ora_lms4_nga 27161 oracle 3.5 1 0.0 37.2mb 46.0mb SLEEP
ora_lms1_nga 27148 oracle 3.3 1 0.0 37.1mb 44.9mb SLEEP
ora_lms5_nga 27163 oracle 3.5 1 0.0 37.1mb 49.5mb SLEEP
ora_lmd0_nga 27144 oracle 0.1 1 0.0 36.7mb 403.3mb SLEEP
ora_arc1_nga 27445 oracle 0.0 1 2.6 35.2mb 54.5mb OTHER
oraclengact1 4556 oracle 0.0 1 0.0 34.1mb 34.1mb SOCKT
ora_arc0_nga 27443 oracle 0.0 1 0.0 34.0mb 50.8mb OTHER
ora_lms3_nga 27157 oracle 3.4 1 0.0 33.9mb 53.6mb SLEEP
ora_ckpt_nga 27190 oracle 0.3 1 6.2 32.7mb 45.8mb OTHER
ora_cjq0_nga 27203 oracle 0.0 1 0.0 31.7mb 468.6mb OTHER
oraclengact1 7650 oracle 0.0 1 0.0 31.3mb 38.6mb SOCKT
ora_lck0_nga 27293 oracle 0.0 1 0.0 29.9mb 35.3mb SLEEP
ora_dbw3_nga 27173 oracle 0.5 1 22.7 28.8mb 35.1mb OTHER
ora_dbw0_nga 27167 oracle 0.8 1 27.3 28.4mb 45.3mb OTHER
ora_dbw1_nga 27169 oracle 0.4 1 14.2 28.1mb 34.1mb OTHER
ora_dbw5_nga 27177 oracle 0.5 1 16.1 28.1mb 34.1mb OTHER
Glance C.04.70.001 12:35:26 actdb1 ia64 Current Avg High
------------------------------------------------------------------------------------------------------------------------------------
CPU Util S SR RU | 38% 44% 48%
Disk Util F F | 10% 12% 21%
Mem Util S SU U | 99% 99% 99%
Networkil U UR R | 95% 95% 95%
------------------------------------------------------------------------------------------------------------------------------------
PROCESS LIST Users= 3
User CPU % Thrd Disk Memory Block
Process Name PID Name (2400% max) Cnt IOrate RSS/VSS On
--------------------------------------------------------------------------------
midaemon 5130 root 11.8 14 0.0 519.0mb 523.2mb SLEEP
vxpal 3817 root 0.0 15 0.0 182.9mb 223.7mb SLEEP
oraclengact1 10805 oracle 3.5 1 0.0 125.0mb 138.5mb SOCKT
vxfsd 330 root 5.1 299 9.2 77.4mb 87.0mb OTHER
java 27769 oracle 0.0 22 0.0 70.5mb 312.1mb SLEEP
oraclengact1 22093 oracle 8.1 1 0.0 68.3mb 74.5mb SOCKT
cimprovagt 4277 root 0.0 34 0.0 57.7mb 131.2mb SLEEP
vxconfigd 742 root 0.0 1 0.0 53.2mb 99.8mb SLEEP
ocssd.bin 25219 oracle 0.6 20 5.8 50.7mb 50.7mb SLEEP
crsd.bin 24999 root 0.1 44 0.0 49.0mb 98.0mb SLEEP
vxpal 4470 root 0.0 47 0.0 43.6mb 149.0mb SLEEP
ora_arc1_nga 1827 root 0.0 1 0.0 40.7mb 43.5mb OTHER
ora_lms2_nga 27150 oracle 3.5 1 0.0 37.2mb 44.7mb SLEEP
ora_lms0_nga 27146 oracle 3.3 1 0.0 37.2mb 49.9mb SLEEP
ora_lms4_nga 27161 oracle 3.5 1 0.0 37.2mb 46.0mb SLEEP
ora_lms1_nga 27148 oracle 3.3 1 0.0 37.1mb 44.9mb SLEEP
ora_lms5_nga 27163 oracle 3.5 1 0.0 37.1mb 49.5mb SLEEP
ora_lmd0_nga 27144 oracle 0.1 1 0.0 36.7mb 403.3mb SLEEP
ora_arc1_nga 27445 oracle 0.0 1 2.6 35.2mb 54.5mb OTHER
oraclengact1 4556 oracle 0.0 1 0.0 34.1mb 34.1mb SOCKT
ora_arc0_nga 27443 oracle 0.0 1 0.0 34.0mb 50.8mb OTHER
ora_lms3_nga 27157 oracle 3.4 1 0.0 33.9mb 53.6mb SLEEP
ora_ckpt_nga 27190 oracle 0.3 1 6.2 32.7mb 45.8mb OTHER
ora_cjq0_nga 27203 oracle 0.0 1 0.0 31.7mb 468.6mb OTHER
oraclengact1 7650 oracle 0.0 1 0.0 31.3mb 38.6mb SOCKT
ora_lck0_nga 27293 oracle 0.0 1 0.0 29.9mb 35.3mb SLEEP
ora_dbw3_nga 27173 oracle 0.5 1 22.7 28.8mb 35.1mb OTHER
ora_dbw0_nga 27167 oracle 0.8 1 27.3 28.4mb 45.3mb OTHER
ora_dbw1_nga 27169 oracle 0.4 1 14.2 28.1mb 34.1mb OTHER
ora_dbw5_nga 27177 oracle 0.5 1 16.1 28.1mb 34.1mb OTHER
/oracle>ps -ef|grep oracle |wc -l
1314
1314
終於同事在共享記憶體段裡面發現了問題:
原來有一段空間沒有釋放回收,而這個共享段的建立程式29637和最後的訪問程式9644都已經不在了
actdb1:/oracle>ipcs -ma
IPC status from /dev/kmem as of Fri Dec 9 12:34:31 2011
T ID KEY MODE OWNER GROUP CREATOR CGROUP NATTCH SEGSZ CPID LPID ATIME DTIME CTIME
Shared Memory:
m 0 0x4118016b --rw-rw-rw- root root root root 0 348 2959 21281 13:29:18 13:29:18 21:12:25
m 1 0x4e0c0002 --rw-rw-rw- root root root root 3 61760 2959 10645 11:34:56 11:43:20 21:12:25
m 2 0x411c98fb --rw-rw-rw- root root root root 2 8192 2959 2961 13:30:49 13:29:18 21:12:25
m 3 0x0000cace --rw-rw-rw- root root root root 0 2 4100 4100 11:14:20 11:14:20 21:13:13
m 4 0x00a5c581 --rw------- sfmdb users sfmdb users 8 10469376 4165 4168 21:13:14 21:13:14 21:13:14
m 5 0x4118061f --rw------- root root root root 1 4096 4318 5732 21:15:48 no-entry 21:15:48
m 6488070 0x4d4e5251 --rw-r--r-- root sys root sys 2 330752 28899 5805 2:51:13 no-entry 0:35:30
m 32775 0x55315352 --rw-rw-rw- root sys root sys 1 4096 28899 22247 11:41:47 11:42:55 0:35:30
m 32776 0x44525354 --rw-r--r-- root sys root sys 3 638976 28899 19619 11:40:28 11:40:28 0:35:30
m 32777 0x53494152 --rw-r--r-- root sys root sys 1 1024 28899 28899 0:35:30 no-entry 0:35:30
m 32778 0x00005643 --rw-rw-rw- root sys root sys 1 1024 28915 28915 0:35:31 no-entry 0:35:31
m 32779 0x00005654 --rw-rw-rw- root sys root sys 1 1024 28915 28915 0:35:31 no-entry 0:35:31
m 131084 0x00000000 D-rw-rw---- oracle dba oracle dba 1 51556487168 29637 9644 1:33:29 1:33:29 1:33:29
m 13 0x06347849 --rw-rw-rw- root root root root 2 65544 5093 5099 21:15:20 21:15:16 21:15:15
m 14 0x0c6629c9 --rw-r----- root root root root 2 17911576 5104 604 10:37:15 10:54:24 21:15:16
m 15 0x4910ab8c --rw-r--r-- root root root root 0 22908 5142 5099 12:34:00 12:34:00 21:15:17
m 10223632 0x5077995c --rw-rw---- oracle dba oracle dba 2580 51556487168 26217 17977 12:34:31 12:34:31 1:44:21
原來有一段空間沒有釋放回收,而這個共享段的建立程式29637和最後的訪問程式9644都已經不在了
actdb1:/oracle>ipcs -ma
IPC status from /dev/kmem as of Fri Dec 9 12:34:31 2011
T ID KEY MODE OWNER GROUP CREATOR CGROUP NATTCH SEGSZ CPID LPID ATIME DTIME CTIME
Shared Memory:
m 0 0x4118016b --rw-rw-rw- root root root root 0 348 2959 21281 13:29:18 13:29:18 21:12:25
m 1 0x4e0c0002 --rw-rw-rw- root root root root 3 61760 2959 10645 11:34:56 11:43:20 21:12:25
m 2 0x411c98fb --rw-rw-rw- root root root root 2 8192 2959 2961 13:30:49 13:29:18 21:12:25
m 3 0x0000cace --rw-rw-rw- root root root root 0 2 4100 4100 11:14:20 11:14:20 21:13:13
m 4 0x00a5c581 --rw------- sfmdb users sfmdb users 8 10469376 4165 4168 21:13:14 21:13:14 21:13:14
m 5 0x4118061f --rw------- root root root root 1 4096 4318 5732 21:15:48 no-entry 21:15:48
m 6488070 0x4d4e5251 --rw-r--r-- root sys root sys 2 330752 28899 5805 2:51:13 no-entry 0:35:30
m 32775 0x55315352 --rw-rw-rw- root sys root sys 1 4096 28899 22247 11:41:47 11:42:55 0:35:30
m 32776 0x44525354 --rw-r--r-- root sys root sys 3 638976 28899 19619 11:40:28 11:40:28 0:35:30
m 32777 0x53494152 --rw-r--r-- root sys root sys 1 1024 28899 28899 0:35:30 no-entry 0:35:30
m 32778 0x00005643 --rw-rw-rw- root sys root sys 1 1024 28915 28915 0:35:31 no-entry 0:35:31
m 32779 0x00005654 --rw-rw-rw- root sys root sys 1 1024 28915 28915 0:35:31 no-entry 0:35:31
m 131084 0x00000000 D-rw-rw---- oracle dba oracle dba 1 51556487168 29637 9644 1:33:29 1:33:29 1:33:29
m 13 0x06347849 --rw-rw-rw- root root root root 2 65544 5093 5099 21:15:20 21:15:16 21:15:15
m 14 0x0c6629c9 --rw-r----- root root root root 2 17911576 5104 604 10:37:15 10:54:24 21:15:16
m 15 0x4910ab8c --rw-r--r-- root root root root 0 22908 5142 5099 12:34:00 12:34:00 21:15:17
m 10223632 0x5077995c --rw-rw---- oracle dba oracle dba 2580 51556487168 26217 17977 12:34:31 12:34:31 1:44:21
actdb1:/oracle>ps -ef | grep 29637
oracle 8172 15104 1 13:42:21 pts/tb 0:00 grep 29637
actdb1:/oracle>ps -ef | grep 9644
oracle 5268 15104 0 13:40:24 pts/tb 0:00 grep 9644
oracle 8172 15104 1 13:42:21 pts/tb 0:00 grep 29637
actdb1:/oracle>ps -ef | grep 9644
oracle 5268 15104 0 13:40:24 pts/tb 0:00 grep 9644
這個問題發生在RMAN問題處理之後,詳細的見:http://user.qzone.qq.com/8733223/blog/1323283285
聯想到當天晚上重啟的操作,其實在重啟的過程中,有報錯
Thu Dec 8 01:39:22 2011
Errors in file /oraclelog/ngact/bdump/ngact1_pmon_18234.trc:
ORA-00304: requested INSTANCE_NUMBER is busy
Thu Dec 8 01:39:22 2011
USER: terminating instance due to error 304
Instance terminated by USER, pid = 17422
重啟兩次都不成功。最終重啟了crs才成功。
當時沒想到無法重啟的原因,現在聯絡到一起,就可以發現了,估計出問題的歸檔程式還是沒殺掉,所以導致共享記憶體段也無法釋放,新的例項也起不來,檢查一下當時出問題的歸檔程式,果然還在
actdb1:/oracle>ps -ef | grep 1827
oracle 1827 1 0 Dec 5 ? 0:00 ora_arc1_ngact1
oracle 6473 15104 0 13:41:11 pts/tb 0:00 grep 1827
這1827已經成為一個殭屍程式了,無法kill掉了,只能等待機器重啟
actdb1:/oracle>kill -9 1827
actdb1:/oracle>ps -ef | grep ora_arc1
oracle 1827 1 0 Dec 5 ? 0:00 ora_arc1_ngact1
最近出問題比較多,也不敢用ipcrm直接清理共享記憶體段,只能安排一次維護重啟來解決這個問題了。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/10867315/viewspace-713370/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 避免PHP-FPM記憶體洩漏導致記憶體耗盡PHP記憶體
- XCode釋放記憶體XCode記憶體
- 記憶體的分配與釋放,記憶體洩漏記憶體
- Linux下php-fpm程式過多導致記憶體耗盡問題解決LinuxPHP記憶體
- vector 的記憶體釋放記憶體
- 資料庫實現原理#6(共享記憶體)資料庫記憶體
- 記憶體資料庫如何發揮記憶體優勢?記憶體資料庫
- 記憶體耗盡後Redis會發生什麼記憶體Redis
- 【記憶體資料庫】TimesTen記憶體資料庫
- 【大頁記憶體】Oracle資料庫配置大頁記憶體記憶體Oracle資料庫
- [20190104]ipcs檢視共享記憶體段.txt記憶體
- Golang 共享記憶體Golang記憶體
- POSIX 共享記憶體記憶體
- [Linux]共享記憶體Linux記憶體
- C# 垃圾回收釋放記憶體C#記憶體
- Android-Fragment 切換造成記憶體溢位,導致記憶體增長AndroidFragment記憶體溢位
- 處理大型資料集而不會耗盡記憶體的方式推薦記憶體
- Qt共享記憶體QSharedMemoryQT記憶體
- Linux共享記憶體(二)Linux記憶體
- nginx共享記憶體分析Nginx記憶體
- QT之共享記憶體QT記憶體
- 故障分析 | MySQL 耗盡主機記憶體一例分析MySql記憶體
- android Handler導致的記憶體洩露Android記憶體洩露
- golang 釋放記憶體機制的探索Golang記憶體
- vector clear() 方法 記憶體釋放問題記憶體
- 如何主動釋放 HeapIdle 的記憶體API記憶體
- C/C++記憶體分配以及釋放C++記憶體
- 【記憶體管理】Oracle如何使用ASMM自動共享記憶體管理記憶體OracleASM
- 記一次排序導致的記憶體危機排序記憶體
- Chrome 再次最佳化記憶體佔用問題,新增記憶體釋放開關Chrome記憶體
- Linux共享記憶體的管理Linux記憶體
- Python中處理大型資料集而不會耗盡記憶體的方式推薦Python記憶體
- Redis記憶體——記憶體消耗(記憶體都去哪了?)Redis記憶體
- .Net記憶體管理釋放的兩種方式記憶體
- Oracle - 資料庫的記憶體結構Oracle資料庫記憶體
- Oracle - 資料庫的記憶體調整Oracle資料庫記憶體
- 瀚高資料庫記憶體結構資料庫記憶體
- OpenResty 和 Nginx 的共享記憶體區是如何消耗實體記憶體的RESTNginx記憶體
- [20191220]關於共享記憶體段相關問題.txt記憶體