身為運維人員,該如何做好企業業務監控?
通常情況下,大部分企業都會做基礎設施監控,認為做好基礎設施監控就可以解決大部分問題,至於業務方面監控,等有人來說了再處理也可以,殊不知這種想法會有多少隱患,以下是詳細的內容:
業務監控要做什麼?
1、Web站點監控
對公網服務的Web站點,無論是SAAS的還是在我們自己部署的站點都需要進行站點URL監控。公網站點監控建議使用商業服務進行監控,因為這些服務通常可以從多個地域來檢測你當前站點的訪問情況,通常是站點狀態碼和響應速度的監控。
對內網服務的Web站點也需要監控,因為內網是無法從公網訪問的,所以內網建議使用自建Prometheus去監控站點的狀態和響應速度。
2、健康檢查介面
此處做服務健康檢查介面監控,提供一個或多個監控API,監控應用自身狀態、監控應用和資料庫連線狀態,監控應用和中介軟體連線狀態。
健康檢查介面建議統一使用/health路徑的介面,如果是三個介面那麼/app_health代表服務、/db_name_health代表資料庫連線狀態、/middleware_name_health代表中介軟體連線狀態。
單獨介面返回APP_OK,db_name_OK,middleware_name_OK,多個介面返回OK表示服務和資料庫和中介軟體正常。
有些JAVA的Sprint框架是自帶健康檢查介面的,這些直接使用即可。
3、日誌監控
首先,所有業務日誌要接入日誌中心。哪些關鍵字需要做告警?需要專案經理和開發負責人討論給出。確保有必要的關鍵字做告警,避免告警的泛濫。
4、鏈路追蹤
鏈路追蹤可以有選擇性的接入,如果業務比較簡單平時執行著也沒有什麼問題可以不用接入。一般業務如果上下游呼叫鏈較多,且業務邏輯比較複雜,同時會有大併發需求,對響應速度要求也比較高的可以接入。
主要給使用者解決找出響應時間較長的API,並檢視是否函式中存在問題。有些商業的鏈路追蹤工具還可以看到SQL語句的問題。這些都可以幫助開發人員更好更快的解決業務程式碼中的問題。
5、大屏監控
針對業務大屏,首先我們要考慮哪些業務資料要放到大屏中?這裡建議放業務負責人或管理層關心的資料。比如:使用者線上人數、使用者訂單實時量資料。
這些資料能讓業務負責人或管理層直觀的看到當前的業務狀況.還可以針對一些預估的異常值進行告警配置。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69952527/viewspace-2920920/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 如何做好運維監控?運維
- 企業如何做好運維管理?運維
- 無監控,不運維:解讀企業全棧式監控運維運維全棧
- 網站經常崩潰,企業應該如何做好監控?網站
- 視覺化業務流程監控,也是一種運維之道視覺化運維
- 如何做好企業IT運維工作?雲端計算運維的工作內容有哪些?運維
- 產業安全專家談|色情/性感如何區分,企業應該如何做好內容風控?產業
- 企業如何做好員工安全意識提升
- 業務流程監控:讓多維度監控有了靈魂
- 視覺化業務流程監控,是解決方案更是運維之道!視覺化運維
- 身邊的人臉安全:員工用人臉作弊工具打卡,企業該如何防範?
- 生產製造業網路運維監控方案運維
- 運維監控工具運維
- 只招2個人,企業能做好內容風控嗎?
- 沒有IT運維,中小企業如何自建企業私有云盤?運維
- 電力行業網路監控IT運維管理解決方案行業運維
- 11款企業網路運維監控軟體彙總介紹-行雲管家運維
- IDC企業如何實現智慧化運維運維
- 企業如何做好FMEA(How)
- 【合集】Linux運維常用的服務監控工具Linux運維
- 運維架構服務監控Open-Falcon運維架構
- 作為運維人員,如何在遠端辦公的同時保障運維效率?運維
- 華為雲:網路安全愈發重要,企業該如何保障自身業務安全?
- 實時監控系統,統一監控企業APIAPI
- Zabbix企業分散式監控工具分散式
- 中小企業的運維之道運維
- 運維監控如何做成 BATJ 的水準運維BAT
- 如何用個人自媒體的運營思維做企業賬號
- 作為IT從業者,你是如何做好個人職業規劃?
- 運動裝企業如何高效打造品牌,擴充業務?
- 作為一個運維人員,如何做事讓老大滿意?運維
- 企業IT監控網管解決方案
- 企業如何為公司、品牌或領導人建立維基百科?
- 如何用企業微信做好私域流量精細化運營?
- Linux運維人員的職業發展方向是怎樣的?Linux運維
- 每個運維人員應該知道的 10 個 Linux 命令!運維Linux
- GitOps 如何改善開發人員和運維人員的日常工作?Git運維
- 業務出海,企業該如何解決這兩個核心問題?