開源系統監控工具Nagios、Zabbix和Open-Falcon的功能特性彙總及優缺點比較

chenfeng發表於2019-03-12

Nagios

Nagios 全名為(Nagios Ain’t Goona Insist on Saintood),最初專案名字是 NetSaint。它是一款免費的開源 IT 基礎設施監控系統,其功能強大,靈活性強,

能有效監控 Windows 、Linux、VMware 和 Unix 主機狀態,交換機、路由器等網路設定等。Nagios核心功能是監控報警,告警能力很不錯,但是圖形展示效果很差。

同時nagios更加靈活,很多功能都要通過外掛化來實現,對於技術能力沒那麼強的同學,上手會有些困難。當然,對於運維老手,上手會很快。


Nagios 的功能特性如下:

• 監控網路服務(SMTP、POP3、HTTP、NNTP、PING等);

• 監控主機資源(處理器負荷、磁碟利用率等);

• 簡單地外掛設計使得使用者可以方便地擴充套件自己服務的檢測方法;

• 並行服務檢查機制;

• 具備定義網路分層結構的能力,用"parent"主機定義來表達網路主機間的關係,這種關係可被用來發現和明晰主機當機或不可達狀態;

• 當服務或主機問題產生與解決時將告警傳送給聯絡人(通過EMail、簡訊、使用者定義方式);

• 可以定義一些處理程式,使之能夠在服務或者主機發生故障時起到預防作用;

• 自動的日誌滾動功能;

• 可以支援並實現對主機的冗餘監控;

• 可選的WEB介面用於檢視當前的網路狀態、通知和故障歷史、日誌檔案等;


Zabbix

Zabbix是一個企業級的開源分散式監控解決方案,支援實施從數以萬計的伺服器、虛擬機器、網路裝置等收集百萬的指標資料,具備常見的商業監控軟體所具備的功能(主機的效能監控、網路裝置效能監控、資料庫效能監控、FTP等通用協議監控、多種告警方式、詳細的報表圖表繪製)支援自動發現網路裝置和伺服器;支援分散式,能集中展示、管理分散式的監控點;擴充套件性強,server提供通用介面,可以自己開發完善各類監控。

Zabbix重要元件說明:

• zabbix server:負責接收agent傳送的報告資訊的核心元件,所有配置、統計資料及運算元據都由它組織進行;

• database storage:專用於儲存所有配置資訊,以及由zabbix收集的資料;

• web interface:zabbix的GUI介面;


• proxy:可選元件,常用於監控節點很多的分散式環境中,代理server收集部分資料轉發到server,可以減輕server的壓力;

• agent:部署在被監控的主機上,負責收集主機本地資料如cpu、記憶體、資料庫等資料發往server端或proxy端;

優點:

• All in One:部署相當便捷

• Server對宿主機效能要求很低。

• 自動發現伺服器與網路裝置

• 分散式監控,以及WEB集中管理功能

• 同時支援agent採集和無agent採集,主機通過agent 或者ipmi採集資料,網路裝置、儲存裝置等通過 SNMP 客戶端採集資料,agent支援常用的UNIX和Windows作業系統

• 功能全面,資料採集、資料儲存、資料展現、事件告警。

• 開放式介面,擴充套件性強,外掛編寫容易

不足:

• 資料庫瓶頸,使用mysql作為底層儲存,大資料讀寫的時候,對於資料庫的壓力非常大

• 需要在主機中安裝agent

• 對容器監控支援不好,需要自己擴充套件。


Open-Falcon

Open-Falcon是小米運維部門開源出來的網際網路企業級監控系統,目前包括小米、金山雲、美團、京東金融、趕集網等都在使用Open-Falcon。Open-Falcon 整體可以分為兩部分,

即繪圖元件、告警元件。“繪圖元件”負責資料的採集、收集、儲存、歸檔、取樣、查詢、展示(Dashboard/Screen)等功能,可以單獨工作,作為time-series data的一種儲存

展示方案。“告警元件”負責告警策略配置(portal)、告警判定(judge)、告警處理(alarm/sender)、使用者組管理(uic)等,可以單獨工作。


關鍵功能特性有:

• 資料採集免配置:agent自發現、支援Plugin、主動推送模式

• 容量水平擴充套件:生產環境每秒50萬次資料收集、告警、儲存、繪圖,可持續水平擴充套件。

• 告警策略自發現:Web介面、支援策略模板、模板繼承和覆蓋、多種告警方式、支援回撥動作。

• 告警設定人性化:支援最大告警次數、告警級別設定、告警恢復通知、告警暫停、不同時段不同閾值、支援維護週期,支援告警合併。

• 歷史資料高效查詢:秒級返回上百個指標一年的歷史資料。

• Dashboard人性化:多維度的資料展示,使用者自定義Dashboard等功能。

• 架構設計高可用:整個系統無核心單點,易運維,易部署。

缺點:

• 支援的監控型別較少,不支援常用應用伺服器如tomcat、apache、jetty等的監控。

• 沒有專門的運維支援,程式碼更新較少,沒有一個較大的社群來維護,後續想要有什麼新的能力基本只能指望自己擴充套件。


Open-Falcon 作為國內首個開源監控系統,可謂大型網際網路公司的首選監控解決方案,比 zabbix的容量更大,使用更方便,節省了運維與開發人員的時間成本。

Open-Falcon官網介紹:

https://book.open-falcon.org/zh_0_2/intro/



附:

Zabbix、Nagios和Open-Falcon的整體優缺點對比圖:

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/15498/viewspace-2638172/,如需轉載,請註明出處,否則將追究法律責任。

相關文章