DKHadoop大資料視覺化平臺監控功能深度解析

adnb34g發表於2019-01-14

在上一篇的文章中已經明確說過 DKM作為大快發行版DKhadoop的管理平臺,它的四大功能分別是:管理功能,監控功能,診斷功能和整合功能。管理功能已經給大家列舉了一些做了說明,今天就DKM平臺的監控功能再給大家做細緻的分享分析。

 

DKM 提供了許多監控功能,用於檢測叢集健康,元件效能以及叢集中執行的作業的效能和資源需求。具體包括以下監控功能:

1、 服務監控

檢視服務和角色例項級別健康檢查的結果,並通過圖表顯示,有助於診斷問題。如果健康檢查發現某個元件的狀態需要特別關注甚至已經出現問題,系統會對管理員應該採取的行動提出建議。同時,系統管理員還可以檢視服務上的或角色上操作的執行歷史,也可以檢視配置更改的審計日誌。

 

2、 主機監控

監控群集內所有主機的有關資訊,包括:哪些主機上線或下線,主機上目前消耗的記憶體,主機上執行的角色例項分配,不同機架上的主機分配等等。彙總檢視中顯示了群集所有主機,並且可以進一步檢視單個主機豐富的細節,包括顯示主機關鍵指標的直觀圖表。

 

DKHadoop大資料視覺化平臺監控功能深度解析

DKHadoop大資料視覺化平臺監控功能深度解析



  3、 行為監控

DKM提供了列表以及圖表的方式來檢視叢集上進行的活動,可以顯示當前正在執行的任務行為,還可以檢視歷史活動。同時提供了各個作業所使用資源的許多統計,系統管理員可以通過比較相似任務的不同效能資料以及比較檢視同一任務中不同執行的效能資料來診斷效能問題或行為問題。

4、 報警

通過配置 DKM可以對指定的事件產生警報。

5、 日誌

介紹如何訪問日誌中的各種考慮到你正在檢視當前上下文的方式。例如,監控服務時,你可以輕鬆地點選一個連結,檢視相關的特定服務的日誌條目,通過相同的使用者介面。當檢視關於使用者的活動資訊,您可以方便地檢視作業執行時所用的作業的主機上發生的相關日誌條目。

6、 叢集及服務實時監控

DKM 會實時的對叢集的各項服務進行監控,一旦服務出現異常,將會產生告警。同時,對叢集的各項效能資料進行監控,例如CPU,記憶體,網路等,一方面能夠監控叢集的效能狀態,一方面能夠幫助效能調優。

 


7、 HDFS 服務監控

HDFS服務為例,HDFS 服務頁面中顯示了服務狀態的彙總資訊,包括HDFS綜述,HDFS 檔案系統塊總數,總大小,檔案總數等 。

 

8、 節點級別監控

DKM 能夠檢視單個節點的各個服務狀態

 

 


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31524777/viewspace-2557173/,如需轉載,請註明出處,否則將追究法律責任。

相關文章