基於報警處理的補充
晚上在琢磨怎麼把報警的處理實現自動化的功能,想來想去,發現其實很多內容都是相通,在紙上寫寫畫畫,簡單理了理自己的思緒。
人嘛,有時候不逼著自己,只會更加懶惰,而一旦邁開了步子,可能就停不下來了,問題也有輕重緩急,我們來理一理。
我的一個簡單總結,問題分為三類,當前問題,潛在問題,歷史問題。
當前問題是實時抓取的狀態資訊,在這個基礎上需要去做一些及時的響應和處理,這個過程也就會涉及到精細化運維的部分
潛在問題需要提前發現,提前預警,這個涉及到半自動化運維,自動化運維
歷史問題,遺留問題,解決起來難度較大,需要資料分析,通過資料的視覺化,或者只能分析來達到目標。
而當前絕大多數的系統來說,問題的處理都是基於報警資訊,也就是基於問題處理問題,所以基於報警資訊的處理,大部分解決的是當前碰到的具體問題。
對於當前的具體問題,分為了幾個層面,
資源使用方面,有下面的一些類別。
這些也是在報警資訊中基本都覆蓋到的一些問題。都從各個層面反應出資料庫,系統,應用的諸多問題。
而基於等待事件,也就是非常流行的OWI,這種方式本身很有說服性,但是經驗論,方法論涉及的成分較多,單純去分析等待事件可能收效不大。
而在此需要額外注意的就是基於DB time的方式,分為兩種,一種是實時的DB time,一種是基於快照的方式,兩種各有優劣,基於實時的DB time計算會基於上一次的快照資料得出一個遞增的動態值,而基於快照的方式得到的是一個靜態值,而且從得到的資料來看,基於快照是後知後覺。報警系統中的很多問題基於DB time可能會引刃而解。但是這種方式有點兒值得推敲的地方,一個就是實時的DB time,可能有一些突發的抖動,可能業務上的需求等,如果溝通不夠充分,可能這類問題基本就是發現問題,分析問題,確認問題,忽略問題這樣的套路。還有一類問題是反反覆覆出現,可能本身影響不算大,比如設定DB time的閾值為400%,結果2分鐘內DB time到了450%,而後迅速跌倒了200%,這種方式如果反反覆覆就會出現大量的報警和報警恢復資訊,這類問題其實還是比較糾結的。
而基於快照的DB time則是一種後知後覺的方式,對於整體的系統負載和問題的基本定位還是大有裨益,但是解決很多突發性的問題可能資訊量不夠。
最後一類是基於併發和鎖,這種問題一旦出現,可能需要立即響應。這種影響的範圍也是全域性性的。
這些資訊如果在Oracle中和優化工具結合起來,如果使用得當,那就是一塊瑰寶,能夠很容易實現精細化運維,半自動化,自動化運維的內容。這些內容現在還在盤算,已經有了一些思路了。相信最近也會逐步理順,付諸實踐。
人嘛,有時候不逼著自己,只會更加懶惰,而一旦邁開了步子,可能就停不下來了,問題也有輕重緩急,我們來理一理。
我的一個簡單總結,問題分為三類,當前問題,潛在問題,歷史問題。
當前問題是實時抓取的狀態資訊,在這個基礎上需要去做一些及時的響應和處理,這個過程也就會涉及到精細化運維的部分
潛在問題需要提前發現,提前預警,這個涉及到半自動化運維,自動化運維
歷史問題,遺留問題,解決起來難度較大,需要資料分析,通過資料的視覺化,或者只能分析來達到目標。
而當前絕大多數的系統來說,問題的處理都是基於報警資訊,也就是基於問題處理問題,所以基於報警資訊的處理,大部分解決的是當前碰到的具體問題。
對於當前的具體問題,分為了幾個層面,
資源使用方面,有下面的一些類別。
這些也是在報警資訊中基本都覆蓋到的一些問題。都從各個層面反應出資料庫,系統,應用的諸多問題。
而基於等待事件,也就是非常流行的OWI,這種方式本身很有說服性,但是經驗論,方法論涉及的成分較多,單純去分析等待事件可能收效不大。
而在此需要額外注意的就是基於DB time的方式,分為兩種,一種是實時的DB time,一種是基於快照的方式,兩種各有優劣,基於實時的DB time計算會基於上一次的快照資料得出一個遞增的動態值,而基於快照的方式得到的是一個靜態值,而且從得到的資料來看,基於快照是後知後覺。報警系統中的很多問題基於DB time可能會引刃而解。但是這種方式有點兒值得推敲的地方,一個就是實時的DB time,可能有一些突發的抖動,可能業務上的需求等,如果溝通不夠充分,可能這類問題基本就是發現問題,分析問題,確認問題,忽略問題這樣的套路。還有一類問題是反反覆覆出現,可能本身影響不算大,比如設定DB time的閾值為400%,結果2分鐘內DB time到了450%,而後迅速跌倒了200%,這種方式如果反反覆覆就會出現大量的報警和報警恢復資訊,這類問題其實還是比較糾結的。
而基於快照的DB time則是一種後知後覺的方式,對於整體的系統負載和問題的基本定位還是大有裨益,但是解決很多突發性的問題可能資訊量不夠。
最後一類是基於併發和鎖,這種問題一旦出現,可能需要立即響應。這種影響的範圍也是全域性性的。
這些資訊如果在Oracle中和優化工具結合起來,如果使用得當,那就是一塊瑰寶,能夠很容易實現精細化運維,半自動化,自動化運維的內容。這些內容現在還在盤算,已經有了一些思路了。相信最近也會逐步理順,付諸實踐。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/23718752/viewspace-2123359/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 關於第五章圖處理的補充說明
- 一條報警資訊的快速處理和分析
- 一條細小的報警簡訊的處理
- 一個慢查詢報警的簡單處理
- 富士變頻器OC報警故障的維修處理方法
- oracle 中 alert 報警日誌過大的處理方法Oracle
- 基於WiFi的防盜報警Python指令碼WiFiPython指令碼
- 第四章: 資料預處理【待補充】
- ORA 12592的報錯處理及補丁更新
- 關於switchover的流程和補充
- 基於 React Redux 的錯誤處理ReactRedux
- 基於Opencv的簡單影像處理OpenCV
- 基於python的事件處理模型Python事件模型
- Elasticsearch開發實戰篇——基於ES的SQL報警引擎ElasticsearchSQL
- Java的一些基礎補充Java
- Golang基礎語法補充Golang
- 《css基礎補充--規範》CSS
- rman基礎知識補充
- 基於ORM思想的資料庫處理ORM資料庫
- 批處理打補丁的方法
- 基於時間序列檢測演算法的智慧報警實現演算法
- 基於Nginx+Keepalived的LB服務監控(郵件報警)Nginx
- python基礎(補充):遞迴的深度Python遞迴
- 關於oracle補充日誌作用的理解Oracle
- C#基礎語法補充C#
- Ninx 基礎入門補充1
- 前端基礎之jQuery重要補充前端jQuery
- 一個可擴充套件的報警系統Quick-Alarm套件UI
- 【筆記】基於Python的數字影象處理筆記Python
- 使用C#處理基於位元流的資料C#
- sprig中基於註解的異常處理
- Oracle 基於使用者管理恢復的處理Oracle
- 12C RAC 打31720486補丁 後報錯處理
- oracle 跨小版本dg切換應用補丁報錯處理Oracle
- 以stc15w408as為核心,基於gsm的紅外報警技術報告
- gdb基礎命令和常用操作補充
- makefile基礎和工作常用點補充
- DG報錯的處理