二所SDD席位Xrec程式啟動失敗案例

mi_zy發表於2017-11-19
二所SDD席位Xrec程式啟動失敗案例
一、現象:
1、監控Xrec程式狀態Down;

2、日誌檔案Xrec.log沒有新增日誌記錄;(透過檔案的修改時間判斷該日誌檔案自從11-18號11:31以來沒寫過日誌;另外注意檔案大小達到2G)

3、中介軟體MID的日誌記錄:stopflage=1表示Down,0表示啟動Normal(flage被定義成Boolean型別,其值只有false和true)

4、頻繁產生core檔案(啟動失敗,Mid中介軟體會一直嘗試啟動,所以會產生大量core檔案,時間長了會造成磁碟空間滿,系統宕掉,為了避免產生core檔案,臨時措施可以將Xrec程式改個名稱


二、檢查方法:
1、gdb Xrec core.28447

gdb出來的資訊表示Xrec.log檔案大小limit exceeded了,見前圖,大於2G。
2、手動刪掉Xrec.log後,Xrec啟動正常,並自動建立Xrec.log檔案


三、原因分析:
1、由於程式設計為一週刪一次日誌檔案Xrec.log,但是如果Xrec.log許可權不對,刪不掉,檔案會越來越大,超出作業系統的限制後,引起Xrec訪問失敗的問題,造成Xrec啟動失敗。
2、日常檢查Xrec.log檔案大小,如果太大,檢查檔案許可權是否正確。
3、命令刪除Xrec.log檔案後,啟動Xrec程式會自動產生Xrec.log檔案,但屬主是cdatc:root,許可權是644,存在每週清理Xrec.log檔案失敗的問題。目前Xrec版本1.1.0,升級後建立日誌檔案會修訂為正確的屬主cdatc:root和許可權766。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/7970627/viewspace-2147451/,如需轉載,請註明出處,否則將追究法律責任。

相關文章