給大家分享一個案例分析-比較偏僻
一、業務主機以及資料庫最近的3次故障現象
4月25號凌晨01:00左右業務主機因為電源問題當機,當天晚上修復。
4月30號下午15:00左右業務記憶體資料庫宕庫。
5月5號下午17:00左右業務記憶體資料庫宕庫。
二、記憶體資料庫宕庫的原因分析
2次宕庫在記憶體資料庫層面都沒有任何錯誤日誌丟擲,Altibase廠家認為不可能是他們的問題,可能是作業系統問題,有可能是環境變數之類的問題。在對比2次宕庫的時間間隔和業務記憶體資料庫主庫和備庫的環境設定之後,發現有個引數設定不同:
業務host1:/home/altibase> ulimit -a
time(seconds) 2097151
業務host2:/home/altibase> ulimit -a
time(seconds) unlimited
該引數的作用是限制一個程式累計的最大cpu時間片值,當altibase程式消耗的CPU總時間達到這個值的時候,altibase程式就被作業系統給kill掉了。
由此可以估算宕庫的間隔時間為:
2097151秒/(24*3600)/(16(我們系統有16顆CPU)*32%(平均的CPU使用率)) = 4.7天
在業務的測試環境上,對這個引數也進行了4次模擬測試,測試結果與上述分析相符,4次都發生了宕庫,可以確定宕庫的原因就是這個引數的設定問題。
三、解決辦法
調整作業系統的引數設定,具體命令如下:
chuser cpu='-1' cpu_hard='-1' altibase
實際上上面兩個引數中起作用的是cpu,即soft_cpu
該引數現已調整,安排進行一次記憶體資料庫的重啟,就可使新的引數設定生效。
4月25號凌晨01:00左右業務主機因為電源問題當機,當天晚上修復。
4月30號下午15:00左右業務記憶體資料庫宕庫。
5月5號下午17:00左右業務記憶體資料庫宕庫。
二、記憶體資料庫宕庫的原因分析
2次宕庫在記憶體資料庫層面都沒有任何錯誤日誌丟擲,Altibase廠家認為不可能是他們的問題,可能是作業系統問題,有可能是環境變數之類的問題。在對比2次宕庫的時間間隔和業務記憶體資料庫主庫和備庫的環境設定之後,發現有個引數設定不同:
業務host1:/home/altibase> ulimit -a
time(seconds) 2097151
業務host2:/home/altibase> ulimit -a
time(seconds) unlimited
該引數的作用是限制一個程式累計的最大cpu時間片值,當altibase程式消耗的CPU總時間達到這個值的時候,altibase程式就被作業系統給kill掉了。
由此可以估算宕庫的間隔時間為:
2097151秒/(24*3600)/(16(我們系統有16顆CPU)*32%(平均的CPU使用率)) = 4.7天
在業務的測試環境上,對這個引數也進行了4次模擬測試,測試結果與上述分析相符,4次都發生了宕庫,可以確定宕庫的原因就是這個引數的設定問題。
三、解決辦法
調整作業系統的引數設定,具體命令如下:
chuser cpu='-1' cpu_hard='-1' altibase
實際上上面兩個引數中起作用的是cpu,即soft_cpu
該引數現已調整,安排進行一次記憶體資料庫的重啟,就可使新的引數設定生效。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/10867315/viewspace-694924/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 給大家分享一個 python 做的搜尋引擎Python
- 給大家分享幾個磁力播放器播放器
- 請大家推薦一個比較好的XML序列化工具!XML
- 大家討論一下比較好Criteria框架。框架
- 做了個知乎專欄小程式版,分享給大家
- linux環境下phpize使用的一個小技巧分享給大家LinuxPHP
- 對live555封裝的比較好的一個類,網上找到的,覺得不錯,給大家共享封裝
- pycharm最新code碼,分享給大家PyCharm
- 幾個分析函式的比較函式
- 一文整理使用過的好用api,分享給大家API
- 幾個比較火的BI分析工具
- 一個字串比較的題字串
- 剛做了一個EDA類庫,大家給看看
- Github | Rust整理資料,分享給大家,多謝大家的支援GithubRust
- 一道比較少見的基礎面試題,考考大家面試題
- 整理了一波免費好用的api,分享給大家API
- 一篇美創科技“中國政務雲資料安全領導者實踐”案例,分享給大家
- Git.Framework 框架隨手記-- 分享一個"比較垃圾"的專案GitFramework框架
- 分享一種比較萬能的居中方式
- 向大家分享一個shell指令碼的坑指令碼
- 一個程式語言比較網站網站
- Mysql 一個比較好用的函式MySql函式
- 一個比較好的shell指令碼指令碼
- 一個比較好的oracle blogOracle
- 索引的分析和比較索引
- 朋友用到的一次不完全恢復案例與大家分享
- 收穫人生第一個 5k Star 開源專案,經驗教訓分享給大家
- 分享幾個比較提高工作效率的軟體
- iOS 一個比較完美的 Growing TextViewiOSTextView
- 一個比較float是否相等的工具類
- tar 命令一個比較有用的引數
- 專案管理的一個案例,聽聽大家的意見專案管理
- 為大家分享一個 Ajax Loading —— spin.jsJS
- 分享兩個可以播放磁力連結的APP給大家:磁力網盤、磁力宅APP
- 【Java分享客棧】從線上環境摘取了四個程式碼優化記錄分享給大家Java優化
- 給大家介紹一個 B站 抖音 影片下載神器
- Dojo與jQuery綜合比較分析jQuery
- 做了一個給IceExt用的小程式(附原始碼)給大家,把RAW變成TXT,希望對大家有用。原始碼