001.常見監控簡介

木二發表於2018-12-31

一 監控架構

1.1 組成

客戶端:資料採集部分
服務端:資料儲存分析告警展示

1.2 採集模式

被動模式:伺服器端到客戶端採集資料,對伺服器的開銷較大,適合小規模的監控環境。
主動模式:客戶端主動上報資料到伺服器端,對伺服器的開銷較小,適合大規模的監控環境。

1.4 協議

專用客戶端採集
公用協議採集:SNMP/SSH/Telnet

1.5 架構

C/S架構:被監控節點較少,產生的資料較少。
C/P/S架構:被監控節點較多,監控型別複雜,產生的資料和網路連線開銷很大,跨地域等環境下。

二 常見監控軟體

流量監控:MTRG、Cacti、SmokePing、Graphite等
效能告警:Nagios、Zabbix、Zenoss、Core、Ganglia、OpenTSDB等

三 常見監控內容

監控專案
描述
主機監控
CPU、記憶體、磁碟的剩餘空間/利用率和I/O、SWAP使用率、系統UP時間、程式數、負載
網路卡監控
Ping的往返時間及包成功率、網路卡流量,包括流入/流出量和錯誤的資料包數
檔案監控
監控檔案大小、Hash值,匹配查詢、字串存在與否
URL監控
監測制定URL訪問過程中的返回碼、下載時間及檔案大小,支援內容匹配
應用程式
埠和記憶體使用率、CPU使用率、服務狀態、請求數、併發連線數、
訊息佇列的位元組數、Client事務處理數、Service狀態等
資料庫
指定的表空間、遊標數、Session數、事務數、死鎖數、緩衝池命中率、庫Cache命中率、
當前連線數、程式的記憶體利用率等效能引數
日誌
錯誤日誌匹配,特定字串匹配
硬體
溫度、風扇轉速、電壓等

四 其他需求

4.1 時間需求

監控系統應根據實際情況,實時/非實時的採集和展示資料,包括歷史趨勢資料展示、分析,容量報表、可用性報告等。

4.2 告警需求

支援多種方式,郵件、簡訊、IM和其他介面,具有可定製化功能。
只是對告警內容分析自動處理,防止誤報、漏報、抖動等。

相關文章