一次RAC資源故障的處理 skgpspawn5 status 11 12
1 事件概述
9月9日,業務無法連線到RAC資料庫。
1.1時間
時間為2013年09月9日
1.2地點
北京、現場&遠端操作
1.3
1.4事件
接到使用者通知,RAC資料庫無法處理業務的連線。
2.分析過程
經過現場工程師緊急到達現場,收集現場日誌,分析:發現alert日誌有如下報錯:
Sun Sep 8 16:31:35 2013
Process startup failed, error stack:
Sun Sep 8 16:31:35 2013
Errors in file /oracle/admin/drutt/bdump/drutt1_psp0_3820.trc:
ORA-27300: OS system dependent operation:fork failed with status: 12
ORA-27301: OS failure message: Not enough space
ORA-27302: failure occurred at: skgpspawn3
Sun Sep 8 16:31:35 2013
Process J005 died, see its trace file
Sun Sep 8 16:31:35 2013
kkjcre1p: unable to spawn jobq slave process
Sun Sep 8 16:31:35 2013
Errors in file /oracle/admin/drutt/bdump/drutt1_cjq0_3881.trc:
Mon Sep 9 01:40:34 2013
Process startup failed, error stack:
Mon Sep 9 01:40:34 2013
Errors in file /oracle/admin/drutt/bdump/drutt1_psp0_3820.trc:
ORA-27300: OS system dependent operation:fork failed with status: 11
ORA-27301: OS failure message: Resource temporarily unavailable
ORA-27302: failure occurred at: skgpspawn5
Mon Sep 9 01:40:35 2013
Process J005 died, see its trace file
Mon Sep 9 01:40:35 2013
kkjcre1p: unable to spawn jobq slave process
Mon Sep 9 01:40:35 2013
Errors in file /oracle/admin/drutt/bdump/drutt1_cjq0_3881.trc:
3.問題定位
判斷是由於系統無法分配新的記憶體空間處理會話連線,導致連線故障:
透過metalink(oracle官方)查詢相關文件:
roubleshooting ORA-27300 ORA-27301 ORA-27302 errors (文件 ID 579365.1)
Ora-27300 OS system dependent operation:fork failed with status: 11 (文件 ID 392006.1)
Database Crashes With ORA-04030 ORA-07445 ORA-27300 ORA-27301 ORA-27302 (文件 ID 580552.1)
Skgpspawn Errors In Alert Log, New Connections to Database Fail (文件 ID 435787.1)
分析定位如下:
Status 11:AGAIN (status 11) : The system lacked the necessary resources to create another process, or the system-imposed limit on the total number of processes under execution system-wide or by a single user {CHILD_MAX} would be exceeded. EAGAIN corresponds to status 11.
Maximum number of PROCESSES allowed per user may be too low;
Status12:STATUS 12 - ENOMEM Not enough core / memory
During an exec or a break, the program asked for more memory than the one available by the system. This error also occurs when there are too many segmentation registers which are required for the arrangement of text data or stack segments.
Swap空間分配不足
4. 處理建議
1.查詢系統分配引數nproc大小,根據Oracle的安裝文件nproc的值至少為4096,而maxuprc的值為nproc*9/10,如果當前程式數量超過設定的值,則根據實際需求重新調整兩個值。
2.swap當時分配不足,建議檢查swap使用情況,注意系統效能情況,當前分配為8G大小,整個實體記憶體為16G。
3.不排除系統記憶體溢位bug導致資源分配問題。
4.如果再次出現此類問題,建議觀察記憶體和swap使用情況,系統日誌,建議重啟伺服器重新釋放資源來解決。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/500314/viewspace-1063633/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 【故障處理】一次RAC故障處理過程
- 【故障處理】ORA- 2730*,status 12故障分析與處理
- 一次dataguard故障處理
- 記一次一波三折的Oracle RAC故障處理Oracle
- 一次TM ENQ故障處理ENQ
- Oracle 10g RAC故障處理Oracle 10g
- 11gR2 ORA-12545故障處理
- 一次ORA-600故障的處理
- Oracle 11.2 故障處理 RAC Removed unused HAIP route: **** usb0OracleREMAI
- 【故障處理】ORA-12162 錯誤的處理
- 【原創】Oracle RAC故障分析與處理Oracle
- 記一次dg故障的處理總結
- 【故障處理】CRS-1153錯誤處理
- 一次direct path read 故障處理
- oracle 10g rac 網路故障處理Oracle 10g
- 【故障處理】DBCA建庫詭異問題處理--rac環境不能建立rac庫
- TNS-01190故障的處理
- 處理Oracle 11gR2 RAC資料庫資源不能自動啟動的問題Oracle資料庫
- ORACLE 10G rac故障處理一例Oracle 10g
- Oracle 11.2.0.4 Dataguard兩則故障處理Oracle
- 處理Oracle 11gR2 RAC資料庫資源不能自動啟動的問題 (轉)Oracle資料庫
- 記一次Oracle資料庫無響應(hang住)故障的處理Oracle資料庫
- 通過AWR報告處理故障一次心得
- ora-01172,01151故障處理
- RAC crs_stat unknown資源狀態處理(ZT)
- mysql 1129處理MySql
- informix資料庫頁故障的處理方法ORM資料庫
- MongoDB故障處理MongoDB
- 【故障處理】RAC環境第二節點無法歸檔的詭異問題處理
- 微服務的故障處理微服務
- 記一次一波三折的Mysql故障處理MySql
- 故障分析 | Greenplum Segment 故障處理
- Oracle 11.2.0.3 RAC環境--ORA-12012 ,ORA-2928 錯誤處理Oracle
- 【故障處理】RedHat5.1 下 Oracle10gR2 RAC 下 ORA-12545 錯誤RedhatOracle
- GPON網路故障如何處理?GPON網路故障處理流程
- 【故障處理】ORA-600:[13013],[5001]故障處理
- 一次資料庫hang的處理資料庫
- 12 種自然語言處理的開源工具自然語言處理開源工具