身為運維人員,該如何做好企業業務監控?
通常情況下,大部分企業都會做基礎設施監控,認為做好基礎設施監控就可以解決大部分問題,至於業務方面監控,等有人來說了再處理也可以,殊不知這種想法會有多少隱患,以下是詳細的內容:
業務監控要做什麼?
1、Web站點監控
對公網服務的Web站點,無論是SAAS的還是在我們自己部署的站點都需要進行站點URL監控。公網站點監控建議使用商業服務進行監控,因為這些服務通常可以從多個地域來檢測你當前站點的訪問情況,通常是站點狀態碼和響應速度的監控。
對內網服務的Web站點也需要監控,因為內網是無法從公網訪問的,所以內網建議使用自建Prometheus去監控站點的狀態和響應速度。
2、健康檢查介面
此處做服務健康檢查介面監控,提供一個或多個監控API,監控應用自身狀態、監控應用和資料庫連線狀態,監控應用和中介軟體連線狀態。
健康檢查介面建議統一使用/health路徑的介面,如果是三個介面那麼/app_health代表服務、/db_name_health代表資料庫連線狀態、/middleware_name_health代表中介軟體連線狀態。
單獨介面返回APP_OK,db_name_OK,middleware_name_OK,多個介面返回OK表示服務和資料庫和中介軟體正常。
有些JAVA的Sprint框架是自帶健康檢查介面的,這些直接使用即可。
3、日誌監控
首先,所有業務日誌要接入日誌中心。哪些關鍵字需要做告警?需要專案經理和開發負責人討論給出。確保有必要的關鍵字做告警,避免告警的泛濫。
4、鏈路追蹤
鏈路追蹤可以有選擇性的接入,如果業務比較簡單平時執行著也沒有什麼問題可以不用接入。一般業務如果上下游呼叫鏈較多,且業務邏輯比較複雜,同時會有大併發需求,對響應速度要求也比較高的可以接入。
主要給使用者解決找出響應時間較長的API,並檢視是否函式中存在問題。有些商業的鏈路追蹤工具還可以看到SQL語句的問題。這些都可以幫助開發人員更好更快的解決業務程式碼中的問題。
5、大屏監控
針對業務大屏,首先我們要考慮哪些業務資料要放到大屏中?這裡建議放業務負責人或管理層關心的資料。比如:使用者線上人數、使用者訂單實時量資料。
這些資料能讓業務負責人或管理層直觀的看到當前的業務狀況.還可以針對一些預估的異常值進行告警配置。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69952527/viewspace-2920920/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 企業如何做好運維管理?運維
- 無監控,不運維:解讀企業全棧式監控運維運維全棧
- 網站經常崩潰,企業應該如何做好監控?網站
- 如何做好企業IT運維工作?雲端計算運維的工作內容有哪些?運維
- 運維監控工具運維
- 作為運維人員,如何在遠端辦公的同時保障運維效率?運維
- 視覺化業務流程監控,也是一種運維之道視覺化運維
- 【IT運維監控】幾大運維監控工具優缺點介紹運維
- 企業如何做好員工安全意識提升
- 運維人員的職業升級道路運維
- 身邊的人臉安全:員工用人臉作弊工具打卡,企業該如何防範?
- 作為一個運維人員,如何做事讓老大滿意?運維
- 運維監控如何做成 BATJ 的水準運維BAT
- 產業安全專家談|色情/性感如何區分,企業應該如何做好內容風控?產業
- 運維監控利器nagios運維iOS
- 視覺化業務流程監控,是解決方案更是運維之道!視覺化運維
- 業務流程監控:讓多維度監控有了靈魂
- IT運維人員的神兵利器運維
- 生產製造業網路運維監控方案運維
- GitOps 如何改善開發人員和運維人員的日常工作?Git運維
- Linux動態:企業應該為Xen做好準備(轉)Linux
- 運維監控系統 PIGOSS BSM的監控策略運維Go
- 體驗監控寶自定義監控 送你《IT運維之道》運維
- 每個運維人員應該知道的 10 個 Linux 命令!運維Linux
- 運維監控指標彙總運維指標
- 11款企業網路運維監控軟體彙總介紹-行雲管家運維
- 運維人員春節放假如何管理伺服器?運維伺服器
- 運維人員如何高效管理千臺伺服器運維伺服器
- 運維人員如何學習python程式設計運維Python程式設計
- 電力行業網路監控IT運維管理解決方案行業運維
- 【devops】智慧運維就是由 AI 代替運維人員?dev運維AI
- 沒有IT運維,中小企業如何自建企業私有云盤?運維
- 影片監控人員違規系統
- LED螢幕監控運維管理方案運維
- ORACLE OGG運維及日常監控Oracle運維
- 運維文件:網站監控系統運維網站
- 分層運維自動化監控運維
- 業務運維運維