MongoDB 異常當機與引數cacheSizeGB

清風艾艾發表於2019-09-16

    近期,處理一MongoDB異常當機故障,與MongoDB引擎引數cacheSizeGB相關,該引數用來限制MongoDB的wiredTiger引擎使用記憶體的量。下邊是故障處理過程,供以後問題處理參考。

    業務方反饋:MongoDB在2019.9.16 9:16:00異常當機,經手工正常重啟,但是檢視mongodb日誌沒有發現異常

報錯。

    問題排查過程:

    1、觀察mongodb的日誌,發現除了手工重啟的記錄,並沒有報錯日誌

    2、根據mongodb執行的機制,它是消耗記憶體的大戶,並且執行在作業系統上的應用軟體無報錯直接當機,

一般是與作業系統資源故障相關,如:主機記憶體、IO、網路等等。

    3、檢視主機作業系統日誌,發現有OOM告警提示

--2019.9.16 9:17:10分,作業系統日誌提示:mongod invoked oom-killer

--2019.9.16 9:17:12分,作業系統日誌提示:作業系統swap空間耗盡

--2019.9.16 9:17:13分,作業系統日誌提示:mongod程式28232被kill掉,被kill時其佔用記憶體31G左右

    4、看作業系統記憶體工32G

    5、檢視mongod的啟動配置檔案,配置檔案中並沒有限制mongod記憶體使用量的引數cacheSizeGB

    6、分析總結:

    2019.9.16 9:17:10~9:17:13,主機記憶體和swap相繼耗盡,引起 oom-killer kill  mongod,導致mongodb資料庫

無疾而終。建議客戶在mongodb的啟動配置檔案中加入mongod的記憶體使用限制引數cacheSizeGB。



來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29357786/viewspace-2657180/,如需轉載,請註明出處,否則將追究法律責任。

相關文章