init.cssd程式啟動失敗

Ice-Spring發表於2013-06-24

地方同事報告生產庫例項1連不上。

遠端到地方伺服器,檢視系統程式狀態,asm和oracle後臺程式沒有啟動。檢視叢集環境程式發現Oracle rac 一節點crs無法啟動,cssd程式處於 /etc/init.d/init.cssd startcheck 啟動檢查階段。

這個庫四川地震時出國當機事件,後恢復,如今例項1離線,是否和hba卡有關係呢,檢視系統與磁碟陣列的連線情況,看磁碟陣列是否掛載在系統下,fdisk -l  系統反饋資訊是沒有掛載磁碟陣列。例項離線是必然的。

例項2現在正常工作,啟動例項1不會對系統照成影響,reboot 例項1資料庫。遠端上去後發現,Oracle RAC /etc/init.d/init.cssd startcheck init.cssd 程式還是無法初始成功。檢視日誌資訊,沒有發現報錯資訊,檢視公有ip和私有ip配置正確,聯通性正常。

系統會報錯嗎?看看系統日誌,cat /var/log/messages | grep error

Jun 24 15:01:08 mss-db1 kernel: SCSI error : <0 0 13 1> return code = 0x10000

Jun 24 15:01:09 mss-db1 kernel: SCSI error : <0 0 13 1> return code = 0x10000

發現大量SCSI error 錯誤。

那hba卡連線問題懷疑性比較大了。前方工程師已經去了機房,重新接好mini線路。系統啟動,oracle例項一重新加入叢集環境。

 

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/28985005/viewspace-764696/,如需轉載,請註明出處,否則將追究法律責任。

相關文章