網路監控系統七大開源工具分析

蔚穎willing發表於2020-07-28

不斷提升企業形象及服務質量、節約成本是所有企業的需求。數字化程式的加速,企業基本都會面臨線上辦公、線上提供產品服務的情況。運維部門為確保企業中所有業務穩定執行,並滿足業務不斷擴張的發展需求,時刻肩負著極大的挑戰。如何節省成本,提升運維工作效率,實現精準監控?

當下,部分企業傾向於用開源軟體節約成本,開源產品如何選型?如何達到企業級效果?我們測試了七個開源產品:Zabbix Nagios Prometheus SugarNMS Ganglia Open-Falcon Cacti ,這些產品都有穩固的使用者基礎且均有更新。我們重點測試了操作,管理工具、介面以及每個產品的監控能力,自動發現、應用場景等情況。
   我們在Windows 上測試了這七款產品,當然並不是這些產品不能在 Linux 上執行。

網路監控系統七大開源工具分析 


Zabbix

商業開源軟體。一個基於WEB 介面的提供分散式系統監視以及網路監視功能的企業級的開源解決方案。使用者群體主要面向泛物聯網企業,主要監控叢集。

支援告警功能,具備擴充套件能力,可自定義監控指標,其主要採用 mysql/postgresql 儲存監控資料,監控規模1000+ 左右。但缺少資料彙總功能,使用上不太方便。而且由於缺少中文資料,服務支援有限,學習成本和定製模板比較大。

 


Nagios

Nagios 是一款開源網路監視工具, 適合監視大量伺服器計算環境,整合了很多功能 可監控主機狀態及網路裝置等。系統或服務狀態出現異常時發出郵件或簡訊報警通知運維人員。

Nagios 可以自定義 shell 指令碼,透過分散式監控模式;支援以冗餘方式進行主機監控,報警設定多樣;出錯的伺服器、應用和裝置會自動重啟自動日誌回滾。

但其配置複雜,初學者費時長。事件控制檯功能較弱,外掛易用性差;對效能、流量等指標的處理不給力;圖形化能力弱;沒有歷史資料,難以追查故障原因。


Prometheus
    Prometheus 是由 Sound Cloud 開源的監控系統,   Google Borg Mo 監控系統的開源版本。主要監控叢集,監控規模 1000+ 左右,監控資料儲存採用比較流行的時序資料庫 opentsdb 。支援告警功能,分層架構設計,擴充套件能力強。

   go 編寫,設計思路主要 for 分散式系統運維服務,多資料展示 (grafana) ,服務自動發現,支援 pull push 支援,支援多客戶端 sdk

但其國內文件不多。有部分英文文件和官方文件。但是描述不是很全面,雖然git star 很多,但是很多特性使用還需要先閱讀程式碼才能解決。


SugarNMS

SugarNMS 是北京智和信通自主研發的綜合監控運維管理平臺,有 C/S B/S 兩種客戶端介面,支援 PC 端及移動端。有監控、分析、運維、安管、日誌、開發等功能模組,有 1000 多種網管功能,管控 600+ 裝置型別,監控規模 10000+ ,可監控國產化系統,自定義擴充套件實現了對裝置及其資源的全面化管理,可管控所有聯網裝置。

自動發現識別裝置、資源、鏈路,生成拓撲圖,透過GIS 地圖、所見即所得的 2.5 機房全景圖、機架圖以及皮膚圖,展現網路情況,監控故障。支援模板功能,自定義監控指標。

監控資料庫儲存可採用Mysql Oracle 、各種主流資料庫、人大金倉、南大通用等。統計有報表和圖形化展示多種形式,能夠自定義監控點。秒級穩定監控,持集中式、代理分散式部署、級聯網管。

網路故障、資料庫停機、網管伺服器停機恢復後,網管系統自動恢復正常。深度管控裝置,可批次裝置的配置檔案升級、備份和恢復功能。

SugarNMS 多層分散式設計,有網管基礎元件,可提供開發整合服務。有框架、 API 、開發庫、外掛、原始碼、文件等資料。

 

Ganglia

Ganglia UCBerkeley 發起的一個開源叢集監視專案,其核心包含 gmond gmetad 以及一個 Web 前端。主要是用來監控系統效能,如 cpu mem 、硬碟利用率, I/O 負載、網路流量情況等,透過曲線很容易見到每個節點的工作狀態,對合理調整、分配系統資源,提高系統整體效能。監控規模 2000+ ,支援自定義監控點。

安裝配置簡單,監控有表格和影像兩種,支援電腦及手機版。不用每臺機器新增配置,支援分層管理。

監控資料儲存在RRD 環形資料庫,但固定大小,會覆蓋舊資料

 


Open-Falcon

Open-Falcon 同樣是做監控系統,適用於巨量的萬級上報節點資料與統計。監控規模 1000+ ,其監控資料歸檔用 RRD ,儲存用 mysql+redis+opentsdb

支援資源自動發現,主動push 資料,支援告警,多種資料展示 (grafana) 。支援自定義監控指標及自定義外掛,支援模板功能。

這個軟體釋出時間叫短,部分功能有待完善;dashbord 上報時間維度 ( 分鐘粒度 ) ,不支援其它維度統計。

 


Cacti

Cacti是一套基於PHP MySQL SNMP及RRDTool(畫圖工具)開發的網路流量監測圖形分析工具。 適用於 收集歷史資料和畫圖。

Cacti基於RRDtool儲存監控資料,在查詢指定時間段的監控資料時候不用瀏覽整個資料檔案,和mrtg的文字log相比具有更高的效率。監控曲線圖片的生成並不像mrtg那樣和資料採集同步並定時成生,而是透過RRDtool提供的圖片成工具使用PHP指令碼來生成動態web圖片。監控專案曲線圖多樣化。RRDtool的圖片生成工具提供了多種引數,這樣可以動態設定更多樣式的曲線圖,也可以將若干監控項集中顯示在一張圖片中。當然,其 如顏色,曲線樣式,圖片大小格式,說明文字等都可以定製產生。基於web配置與監控,操作簡單。Cacti支援超過二十種的外掛,豐富的外掛資源,大大提高了cacti的功能。

Cacti主要的功能強大在於他的畫圖功能,所以說它的其他功能都是靠它的外掛來完成的,我們必須手動去新增所需外掛。例如:當我們需要報警功能 ,我們必須安裝thold外掛。當需要新增多臺監控裝置時,我們只能一個一個的新增,並一個一個的新增相應的監控項 配置繁瑣。

 

款產品都很好 這些產品都是企業級產品嗎?總體來說,我們發現 款產品都適合在中小型企業中使用,其中SugarNMS可以在大型網組中使用, 支援10000+裝置量監控, 高容量或地理分佈 部署 整體表現的話SugarNMS 可能 更勝一籌。SugarNMS 安裝、介面簡潔 拓撲功能強大,配置靈活, 資訊易於閱讀, 支援遠端部署及監控

我們發現每審查一次網路監控工具,都會發現他們的改進,挖掘客戶的監測需求是供應商共同的管理重點。 款產品 Prometheus是一個完全開源的、不依賴與任何商業公司的專案,有多個公司、個人維護支援 其他 都有商業付費版,但是還有所不同,例如,Zabbix僅在一個具有可選付費支援計劃的開放原始碼版本中可用。而SugarNMS則提供了平臺級的版本,支援了自定義擴充套件和開發整合。如果要在大型企業或高度複雜的環境中使用,最好諮詢供應商並進行商業評估。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69948630/viewspace-2707515/,如需轉載,請註明出處,否則將追究法律責任。

相關文章