淺談Orabbix監控指標
對於Orabbix監控Oracle來說,它是提供了一個相對輕量級的客戶端來綜合監控多個資料庫例項。從這一點來看,它的角色有點類似於工作中使用的SQLDeveloper或者toad這類的工具。
在之前的章節中,先花了些篇幅去比較zabbix和grid control,其實從功能上來看,基於zabbix的Orabbix的監控功能要有限的多。提供的預設模板中,監控觸發器不到20個。
自己梳理了一下,預設的監控觸發器在15個左右。
在這個基礎上進行了一些額外的補充,比如去檢測dg是否可用,檢測閃回區空間利用率是否合理,監控記憶體使用率是否過高等等。
其實和實際工作結合起來還有不少的盲點。
比如監聽器的監控
是否有有大量的並行查詢
DB響應時間的監控
ASM的一些基本監控
rac例項的監控
所以把問題以面鋪開來看,還有很多的工作需要做,而不只是侷限於當前的監控指標。
當然了也不能這麼為難orabbix,我相信這個開發者是希望在Oracle的監控上有所突破,但是還是給我們留下了不少的功課去完成。
自己在sourceforge上下載了原始碼,原始碼的實現是基於java,依賴於zabbix基礎工程,程式碼量其實不大,如果能夠在這個基礎上進行深入擴充套件,可能還會有更多的驚喜。
比如目前使用orabbix監控表空間的使用明細,比如在資料庫A中有10個表空間,在資料庫B中有5個表空間,對於表空間的空間剩餘量的監控透過SQL就會是下面的形式。
TS1 5%
TS2 9%
TS3 20%
TS4 30%
比如我們需要監控剩餘比例在10%以內的,那就是說TS1,TS2了。目前的實現是把結果集當做一個text來對待,還不能把結果集中的每一列單獨來處理,所以郵件報警的顯示還是不夠清晰。還得藉助於結果集,然後再次進行指令碼格式化顯示,實現起來還是不夠那麼靈活。這個也是我下一步需要攻關的點。
如果我們較真一下,比較一下gc和orabbix的監控指標,gc裡面有300多個,粒度,數量上遠遠超過了orabbix,但是如果你自己靜下心來,似乎自己常用的指標其實不到10%。
還是選擇適合自己的,滿足工作就可以。
在之前的章節中,先花了些篇幅去比較zabbix和grid control,其實從功能上來看,基於zabbix的Orabbix的監控功能要有限的多。提供的預設模板中,監控觸發器不到20個。
自己梳理了一下,預設的監控觸發器在15個左右。
故障型別 | 報警對應項 | 錯誤型別 | 報錯簡述 |
資料庫沒有資料響應 | Oracle:alive | High | 資料庫無資料響應 |
資料庫例項不可用 | Oracle:alive | High | 資料庫例項是否可用 |
資料庫中存在鎖 | Oracle:locks | High | 資料庫中存在鎖 |
session使用量過高 | (Oracle:session.last(0)}*100/Oracle:maxsession.last(0)})>80 | High | session過多,比如session超過80% |
Process 使用量過高 | (Oracle:procnum.last(0)}*100/Oracle:maxprocs.last(0)})>80 | High | process過多,比如process超過80% |
異常資訊的通用審計 | Oracle:audit | High | 異常資訊的審計,比如密碼錯誤次數過多 |
active session數過高 | Oracle:session_active | High | active session數 |
使用者異常鎖定 | Oracle:users_locked | Warning | 使用者密碼過期或者錯誤登入次數過多賬戶鎖定 |
表空間使用率過高 | Oracle:showtsps | Warning | 表空間使用率超過90% |
歸檔日誌量過高 | Oracle:archive | Warning | 歸檔日誌量 |
正常執行時間 | Oracle:uptime | Average | 正常執行情況 |
PGA 使用量過高 | (Oracle:pga.last(0)}*100/Oracle:pga_aggregate_target.last(0)})>90 | Average | PGA使用率過高 |
快取命中率不足 | Oracle:hitratio_table_proc.avg(60)}<50|Oracle:hitratio_trigger.avg(60)}<50|Oracle:hitratio_sqlarea.avg(60)}<50|Oracle:hitratio_body.avg(60)}<50 | Information | 快取命中率不足 |
在這個基礎上進行了一些額外的補充,比如去檢測dg是否可用,檢測閃回區空間利用率是否合理,監控記憶體使用率是否過高等等。
datagurad不可用 | Oracle:dg_error | High | datagurad不可用 |
剩餘記憶體不足2G | Oracle:vm.memory.size[free].last()}<2048m | Warning | 剩餘記憶體不足2G |
閃回區使用率過高 | Oracle:archive_area_usage | Warning | 閃回區使用率過高 |
其實和實際工作結合起來還有不少的盲點。
比如監聽器的監控
是否有有大量的並行查詢
DB響應時間的監控
ASM的一些基本監控
rac例項的監控
所以把問題以面鋪開來看,還有很多的工作需要做,而不只是侷限於當前的監控指標。
當然了也不能這麼為難orabbix,我相信這個開發者是希望在Oracle的監控上有所突破,但是還是給我們留下了不少的功課去完成。
自己在sourceforge上下載了原始碼,原始碼的實現是基於java,依賴於zabbix基礎工程,程式碼量其實不大,如果能夠在這個基礎上進行深入擴充套件,可能還會有更多的驚喜。
比如目前使用orabbix監控表空間的使用明細,比如在資料庫A中有10個表空間,在資料庫B中有5個表空間,對於表空間的空間剩餘量的監控透過SQL就會是下面的形式。
TS1 5%
TS2 9%
TS3 20%
TS4 30%
比如我們需要監控剩餘比例在10%以內的,那就是說TS1,TS2了。目前的實現是把結果集當做一個text來對待,還不能把結果集中的每一列單獨來處理,所以郵件報警的顯示還是不夠清晰。還得藉助於結果集,然後再次進行指令碼格式化顯示,實現起來還是不夠那麼靈活。這個也是我下一步需要攻關的點。
如果我們較真一下,比較一下gc和orabbix的監控指標,gc裡面有300多個,粒度,數量上遠遠超過了orabbix,但是如果你自己靜下心來,似乎自己常用的指標其實不到10%。
還是選擇適合自己的,滿足工作就可以。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/23718752/viewspace-1770782/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Orabbix監控指標指標
- Zabbix透過Orabbix監控OracleOracle
- EMQ 監控指標MQ指標
- mongodb 監控指標MongoDB指標
- Java程式監控指標Java指標
- 【原創】淺談指標(一)指標
- 【原創】淺談指標(二)指標
- 【原創】淺談指標(三)指標
- 【原創】淺談指標(四)指標
- 系統監控&JVM監控指標資料查詢JVM指標
- 【原創】淺談指標(十三)指向陣列的指標指標陣列
- MYSQL和SQLServer效能監控指標MySqlServer指標
- 微服務:指標和健康監控微服務指標
- 運維監控指標彙總運維指標
- beta版 tomcat 應用監控指標Tomcat指標
- 【原創】淺談指標(十一)alloca函式指標函式
- 分散式架構的監控與指標分散式架構指標
- 04、MySQL Case-MySQL常用監控指標MySql指標
- 基於 prometheus 的微服務指標監控Prometheus微服務指標
- 如何高效利用 Grafana 監控分析 TiDB 指標GrafanaTiDB指標
- 【原創】淺談指標(十二)關於static(上)指標
- 使用Prometheus監控Linux系統各項指標PrometheusLinux指標
- 【原創】淺談指標(九)二維陣列和多級指標相關指標陣列
- 【原創】淺談指標(七)字串相關(詳細版本)與指標運算指標字串
- 監控雜談
- PostgreSQL實時健康監控大屏-低頻指標SQL指標
- 實戰| 配置DataDog監控Apache Hudi應用指標Apache指標
- 【系統設計】指標監控和告警系統指標
- 【原創】淺談指標(十)連結串列的寫法指標
- 【原創】淺談指標(八)字串相關函式(下集)指標字串函式
- go 服務監控指標(metric)上報open-falconGo指標
- OpenTelemetry 實戰:從零實現應用指標監控指標
- k8s監控指標整改のthanos轉VictoriaMetricsK8S指標
- 圖解JanusGraph系列 - JanusGraph指標監控報警(Monitoring JanusGraph)圖解指標
- 淺談水電站閘門PLC遠端監控系統
- 淺談script標籤
- 淺談電商搜尋資料指標體系建設指標
- 中介軟體IIS監控指標、配置和Windbg除錯分析指標除錯
- 重構指標之如何監控程式碼圈複雜度指標複雜度