MongoDB 異常當機與引數cacheSizeGB

清風艾艾發表於2019-09-16

原文網址 : http://blog.itpub.net/29357786/viewspace-2657180/

MongoDB

近期，處理一MongoDB異常當機故障，與MongoDB引擎引數cacheSizeGB相關，該引數用來限制MongoDB的wiredTiger引擎使用記憶體的量。下邊是故障處理過程，供以後問題處理參考。

業務方反饋：MongoDB在2019.9.16 9:16:00異常當機，經手工正常重啟，但是檢視mongodb日誌沒有發現異常

報錯。

問題排查過程：

1、觀察mongodb的日誌，發現除了手工重啟的記錄，並沒有報錯日誌

2、根據mongodb執行的機制，它是消耗記憶體的大戶，並且執行在作業系統上的應用軟體無報錯直接當機，

一般是與作業系統資源故障相關，如：主機記憶體、IO、網路等等。

3、檢視主機作業系統日誌，發現有OOM告警提示

--2019.9.16 9:17:10分，作業系統日誌提示：mongod invoked oom-killer

--2019.9.16 9:17:12分，作業系統日誌提示：作業系統swap空間耗盡

--2019.9.16 9:17:13分，作業系統日誌提示：mongod程式28232被kill掉，被kill時其佔用記憶體31G左右

4、看作業系統記憶體工32G

5、檢視mongod的啟動配置檔案，配置檔案中並沒有限制mongod記憶體使用量的引數cacheSizeGB

6、分析總結：

2019.9.16 9:17:10~9:17:13，主機記憶體和swap相繼耗盡，引起 oom-killer kill mongod，導致mongodb資料庫

無疾而終。建議客戶在mongodb的啟動配置檔案中加入mongod的記憶體使用限制引數cacheSizeGB。

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/29357786/viewspace-2657180/，如需轉載，請註明出處，否則將追究法律責任。

Kotlin藝術探索之引數和異常
2019-06-03
Kotlin
一次 Jedis 引數異常引發服務雪崩
2023-10-24
SQLServer mirror當機後error 9004異常處理
2020-05-07
SQLServerError
python自定義異常，使用raise引發異常
2020-11-14
PythonAI
mongoDB當機修復
2024-04-11
MongoDB
異常處理機制(二)之異常處理與捕獲
2023-11-14
Spring-RestTemplate之urlencode引數解析異常全程分析
2019-03-27
SpringREST
Java 異常隨機數包裝類
2024-07-04
Java隨機
oracle 11.2.0.4 rac節點異常當機之ORA-07445
2018-05-22
Oracle
Spring Boot統一異常處理以及引數校驗
2019-02-17
Spring Boot
【PARANETERS】Oracle異常恢復相關的隱含引數
2021-09-24
Oracle
異常與IO
2019-03-04
Java 異常表與異常處理原理
2019-01-27
Java
記憶體管理實戰案例分析1：缺頁異常和檔案系統引發的當機
2022-03-16
記憶體
Linux基礎——BClinux8.2 排查vmcore異常當機問題
2024-05-06
Linux
MySQL：MGR修改max_binlog_cache_size引數導致異常
2020-10-28
MySql
Java - 異常與File
2024-08-04
Java
Java異常機制
2024-04-30
Java
[譯] Ruby 2.6 Kernel 的system 方法增加是否丟擲異常引數。
2018-08-01
[譯] Ruby 2.6 增加了 Integer 和 Float 方法的異常引數
2018-08-02
C#規範整理·異常與自定義異常
2019-06-24
C#
nginx 常見引數以及重定向引數配置
2020-05-19
Nginx
線上ES叢集引數配置引起的業務異常案例分析
2023-11-23
python錯誤與異常
2022-01-18
Python
異常篇—— VEH 與 SEH
2022-02-28
機器學習引數模型與非引數模型/生成模型與判別模型
2018-03-18
機器學習模型
異常處理機制
2024-08-05
一場 Kafka CRC 異常引發的血案
2024-09-02
Kafka
python生成器呼叫方法引發異常
2021-09-11
Python
ORACLE 11.2.0.4 rac for linux 鏈路宕導致的單節點異常當機
2018-06-23
OracleLinux
用Go語言異常機制模擬TryCatch異常捕捉
2020-08-17
Go
把介面當作引數傳入
2024-10-17
前端效能與異常上報
2019-03-04
前端
Java異常處理機制
2018-08-04
Java
C++ 異常機制（上）
2021-01-16
C++
電腦經常當機是什麼原因電腦經常當機解決方法
2022-09-30
深度覆盤-重啟 etcd 引發的異常
2023-02-09
【高併發】由InterruptedException異常引發的思考
2022-11-25
Exception

MongoDB 異常當機與引數cacheSizeGB

相關文章