給大家分享一個案例分析-比較偏僻
一、業務主機以及資料庫最近的3次故障現象
4月25號凌晨01:00左右業務主機因為電源問題當機,當天晚上修復。
4月30號下午15:00左右業務記憶體資料庫宕庫。
5月5號下午17:00左右業務記憶體資料庫宕庫。
二、記憶體資料庫宕庫的原因分析
2次宕庫在記憶體資料庫層面都沒有任何錯誤日誌丟擲,Altibase廠家認為不可能是他們的問題,可能是作業系統問題,有可能是環境變數之類的問題。在對比2次宕庫的時間間隔和業務記憶體資料庫主庫和備庫的環境設定之後,發現有個引數設定不同:
業務host1:/home/altibase> ulimit -a
time(seconds) 2097151
業務host2:/home/altibase> ulimit -a
time(seconds) unlimited
該引數的作用是限制一個程式累計的最大cpu時間片值,當altibase程式消耗的CPU總時間達到這個值的時候,altibase程式就被作業系統給kill掉了。
由此可以估算宕庫的間隔時間為:
2097151秒/(24*3600)/(16(我們系統有16顆CPU)*32%(平均的CPU使用率)) = 4.7天
在業務的測試環境上,對這個引數也進行了4次模擬測試,測試結果與上述分析相符,4次都發生了宕庫,可以確定宕庫的原因就是這個引數的設定問題。
三、解決辦法
調整作業系統的引數設定,具體命令如下:
chuser cpu='-1' cpu_hard='-1' altibase
實際上上面兩個引數中起作用的是cpu,即soft_cpu
該引數現已調整,安排進行一次記憶體資料庫的重啟,就可使新的引數設定生效。
4月25號凌晨01:00左右業務主機因為電源問題當機,當天晚上修復。
4月30號下午15:00左右業務記憶體資料庫宕庫。
5月5號下午17:00左右業務記憶體資料庫宕庫。
二、記憶體資料庫宕庫的原因分析
2次宕庫在記憶體資料庫層面都沒有任何錯誤日誌丟擲,Altibase廠家認為不可能是他們的問題,可能是作業系統問題,有可能是環境變數之類的問題。在對比2次宕庫的時間間隔和業務記憶體資料庫主庫和備庫的環境設定之後,發現有個引數設定不同:
業務host1:/home/altibase> ulimit -a
time(seconds) 2097151
業務host2:/home/altibase> ulimit -a
time(seconds) unlimited
該引數的作用是限制一個程式累計的最大cpu時間片值,當altibase程式消耗的CPU總時間達到這個值的時候,altibase程式就被作業系統給kill掉了。
由此可以估算宕庫的間隔時間為:
2097151秒/(24*3600)/(16(我們系統有16顆CPU)*32%(平均的CPU使用率)) = 4.7天
在業務的測試環境上,對這個引數也進行了4次模擬測試,測試結果與上述分析相符,4次都發生了宕庫,可以確定宕庫的原因就是這個引數的設定問題。
三、解決辦法
調整作業系統的引數設定,具體命令如下:
chuser cpu='-1' cpu_hard='-1' altibase
實際上上面兩個引數中起作用的是cpu,即soft_cpu
該引數現已調整,安排進行一次記憶體資料庫的重啟,就可使新的引數設定生效。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/10867315/viewspace-694924/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 給大家分享一個 python 做的搜尋引擎Python
- 自己最近搭建的一個docker映象站,分享給大家!Docker
- 給大家分享幾個磁力播放器播放器
- 給大家推薦一個方法
- linux環境下phpize使用的一個小技巧分享給大家LinuxPHP
- pycharm最新code碼,分享給大家PyCharm
- 做了個知乎專欄小程式版,分享給大家
- 幾個比較火的BI分析工具
- 一文整理使用過的好用api,分享給大家API
- Github | Rust整理資料,分享給大家,多謝大家的支援GithubRust
- 整理了一波免費好用的api,分享給大家API
- 一道比較少見的基礎面試題,考考大家面試題
- 向大家分享一個shell指令碼的坑指令碼
- 一篇美創科技“中國政務雲資料安全領導者實踐”案例,分享給大家
- 一個比較麻煩的限流需求
- iOS 一個比較完美的 Growing TextViewiOSTextView
- Go和Python比較的話,哪個比較好?GoPython
- 給大家安利一下 PowerShell
- 收穫人生第一個 5k Star 開源專案,經驗教訓分享給大家
- 一個比較float是否相等的工具類
- 分享幾個比較提高工作效率的軟體
- 分享兩個可以播放磁力連結的APP給大家:磁力網盤、磁力宅APP
- 資料分析領域幾個常用工具比較
- 一波了!一波了!==== 今天閱讀原始碼學習了一個 204 的狀態碼,分享給大家。原始碼
- 探討一個比較複雜的查詢
- 個人比較反感的一些寫法
- 【Java分享客棧】從線上環境摘取了四個程式碼優化記錄分享給大家Java優化
- 給大家介紹一個 B站 抖音 影片下載神器
- 給大家推薦一個可以下載年鑑的網址!
- 整理了一些熱門、含免費次數的api,分享給大家API
- flutter仿boss直聘,一個比較完整的例子(一)Flutter
- 比較兩個table是否相同
- 3 個 Python 模板庫比較Python
- JavaScript比較兩個時間JavaScript
- 做自媒體必備的幾大工具,分享給大家
- 把最新青書學堂成教助手軟體分享給大家
- 發現兩個應用(磁力網盤、磁力宅),可以播放磁力連結,分享給大家~~
- 發現兩個可以播放磁力連結的APP(磁力網盤、磁力宅),分享給大家APP
- 比較 Pandas、Polars 和 PySpark:基準分析Spark