HP-UX上一次Oracle軟體安裝目錄磁碟空間滿導致的故障
客戶反饋,應用端出現了磁碟讀寫錯誤:
同時,登入資料庫時也出現了錯誤:
同時,使用者反饋說部分業務已經中斷
登入作業系統, 通過查詢gv$instance檢視,得知是一個雙節點的11gR2的叢集
檢查節點1的資料庫告警日誌,ASM告警日誌,CRSD日誌,未發現近期可疑錯誤資訊
登入節點2, 發現資料庫服務的/oracle目錄的空間佔用已達到100%。檢查磁碟檔案空間佔用發現, 監聽的產生的listener.log, XML檔案佔用了大量空間,遂清理之
從報錯日誌來看,磁碟寫入出現了問題,懷疑資料檔案有物理壞塊。但是用dbv userid/password file='+DATA/資料庫名/datafile/system.345' 並未檢查出有壞塊
清理出oracle軟體安裝目錄之後,使用者反映業務已經恢復正常。 但是對於這個錯誤還是有點不解,為什麼磁碟空間的問題會導致資料檔案寫入的錯誤。
繼續檢查:
ASM的告警日誌中出現瞭如下的資訊:
Tue Jun 12 17:00:27 2018
Non critical error DIA-48181 caught while writing to trace file "/oracle/app/diag/asm/+asm/+ASM2/trace/+ASM2_ora_5142.trc"
Error message: HPUX-ia64 Error: 28: No space left on device
Additional information: 1
Writing to the above trace file is disabled for now on...
Non critical error ORA-48113 caught while writing to trace file "/oracle/app/diag/asm/+asm/+ASM2/trace/+ASM2_ora_14098.trc"
Error message:Writing to the above trace file is disabled for now on...
WARNING: ASM communication error: op 0 state 0x0 (15055)
ERROR: direct connection failure with ASM
NOTE: Deferred communication with ASM instance
這裡已經出現了ASM連線中斷的資訊。
難怪會出現磁碟讀寫錯誤
清理掉日誌檔案之後,告警日誌裡也沒有新的資訊寫入
檢查叢集元件狀態:
$ /oracle/grid/bin/crsctl check crs
CRS-4638: Oracle High Availability Services is online
CRS-4535: Cannot communicate with Cluster Ready Services
CRS-4529: Cluster Synchronization Services is online
CRS-4533: Event Manager is online
CRS服務已經出現了問題
總結:
應可以推斷出,/oracle目錄磁碟空間佔滿,導致了資料庫例項通過ASM讀寫資料檔案時,登入ASM出現了錯誤。 此時就出現了前文中所示的寫入system表空間的錯誤
這裡還有一個比較關鍵的提示:
ORA-29701: unable to connect to Cluster Sychironization Service
這裡已經是叢集層面的程式出現問題了。與資料檔案本身並無聯絡(清理空間後業務也恢復了正常)
同時給了客戶建議:
改善建議:
1. 建議部署crontab指令碼,定期清理/oracle目錄下的監聽日誌以及日誌相關的xml檔案
2.
CRS叢集本身已經出現了問題,且經過很久之後也未恢復,建議重啟CRS叢集服務
通過
/oracle/grid/bin/crsctl stop crs
/oracle/grid/bin/crsctl start crs
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/8520577/viewspace-2156173/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- MySQL 磁碟空間滿導致表空間相關資料檔案損壞故障處理MySql
- Oracle SYSAUX 表空間使用率100% 導致的DB 故障OracleUX
- 解決docker容器存放目錄磁碟空間滿了問題Docker
- ORACLE DATAGUARD災備歸檔空間滿導致的ORA-00600 [2619]Oracle
- Elasticsearch 磁碟空間異常:一次成功的故障排除案例分享Elasticsearch
- [20230201]磁碟空間爆滿.txt
- Oracle目錄由於TFA觸發bug導致jdb檔案未自動清理引起空間不足Oracle
- ASM空間爆滿導致資料庫掛起ASM資料庫
- Oracle 擴充磁碟空間Oracle
- Oracle表空間切換路徑,解決硬碟滿導致的ORA-01653問題Oracle硬碟
- 伺服器磁碟空間滿了伺服器
- VMware之Ubuntu20.04擴充根目錄磁碟空間Ubuntu
- ORACLE ASM的SSD磁碟空間回收分析OracleASM
- ORACLE ASM磁碟組空間溢位OracleASM
- Linux磁碟空間佔滿問題快速排雷Linux
- macOS Mojave 沒有 /usr/include 目錄導致編譯安裝 PHP 失敗Mac編譯PHP
- ORA-19909(一次DataGuard Failover導致的故障AI
- 執行SQL查詢導致磁碟耗盡故障演示SQL
- 磁碟IO故障導致的SQLServer資料庫無法寫入SQLServer資料庫
- 使用查詢語句導致 RDS 伺服器報硬碟磁碟空間不足伺服器硬碟
- 2.2. 安裝Oracle軟體Oracle
- Linux空間不足怎麼辦?磁碟滿了如何清理?Linux
- Oracle RAC日常運維-NetworkManager導致叢集故障Oracle運維
- 靜默方式安裝、升級oracle(一): 安裝oracle軟體Oracle
- 記一次儲存問題導致的rac故障案例
- 【YashanDB知識庫】archivelog磁碟滿導致資料庫abnormalHive資料庫ORM
- VMware虛擬機器Ubuntu根目錄磁碟空間(/dev/sda1)擴容虛擬機Ubuntudev
- Oracle 目錄許可權丟失故障恢復Oracle
- 一次JVM記憶體問題導致的線上事故JVM記憶體
- 磁碟空間不足
- ubuntu重新分配根目錄儲存空間-將根目錄空間縮小騰出給別的位置Ubuntu
- oracle sysaux表空間滿了處理辦法OracleUX
- 在Centos 上安裝oracle-database-preinstall-19c軟體包CentOSOracleDatabase
- AMH軟體目錄
- 11. Oracle for Linux安裝和配置—11.3. Oracle安裝和配置—11.3.1. Oracle軟體安裝OracleLinux
- 【資料庫資料恢復】磁碟空間不足導致sql server錯誤的資料恢復資料庫資料恢復SQLServer
- 記一次Win10磁碟空間清理 robocopy mklinkWin10
- Linux空間不足怎麼辦?Linux磁碟滿了怎麼清理?Linux