多變的智慧降噪

ruixiangyun發表於2021-11-17

告警、作為監控的平臺的最直觀的體現形式,可以體現出被“監控者”的當前狀態,你可以看到它是健康十足的平穩狀態,亦或是偶爾發出告警的異常狀態,甚至是告警癲狂的崩潰狀態,這都是最直觀的告訴你他是否需要你的方式。但如果沒有好的梳理方式,反而會讓人沒辦法正確的發現它此時的情況,今天我們就來說下如何透過智慧告警平臺Cloud Aler中的智慧降噪的功能,實現告警的靈活處理。

睿象雲智慧降噪Cloud Alert中,有三種降噪的類別,分別為:自定義規則降噪、時間視窗智慧降噪、實時智慧降噪;分為兩種降噪方式,一種是單點降噪,一種是序列降噪。

【自定義規則降噪】使用者可以透過自行設定規則的方式,讓滿足規則的告警產生壓縮,從而讓告警有序的壓縮去重,減少不必要的告警通知;例如可以設定指定內容的告警進行壓縮,也可以設定指定主機+指定內容的告警組合的方式進行壓縮。如果對告警和整個監控業務邏輯比較清楚的使用者,就比較推薦這種方式了。

【時間視窗智慧降噪】是透過選定指定的時間段,讓指定的時間段的告警進行壓縮降噪,這種方式就是讓時間點和平臺自有的降噪演算法相結合,這種降噪的類別對於總是在某個時間段內產生異常的監控有出奇的效果,使用者可以清楚地觀察到某些時間段內激增的告警中,主要的告警有哪些,進而更快的排查到問題的根因。

【實時智慧降噪】在勾選了演算法降噪之後,平臺就會實時監控告警資料,滿足演算法降噪需求的告警,就會產生壓縮,從而過濾掉一些不必要的通知,讓告警不在煩亂複雜。對於使用者的監控平臺告警繁多且複雜的使用者,就比較推薦這種方式了。

對於使用場景,使用者可以選擇一種降噪類別進行單點降噪的方式,例如如果使用者深知自己的告警邏輯和場景情況,推薦使用自定義規則降噪的方式,這樣更加的精準且直接,結果也是最高效的一種方式;亦或是使用者的監控在一天的時間內總是在某個時間段內告警量激增,也沒有什麼規律性,就比較推薦時間窗智慧降噪的方式,這樣的告警的通知就既不會在某個時間段內突然激增,進而對使用者造成煩擾,又能透過降噪的方式讓使用者更快的查詢到問題的根因;如果監控平臺一天內產生的告警量較大,或者業務上的告警頻繁,且產生的頻率比較平穩,這時候就更推薦使用實時智慧降噪的方式進行壓縮降噪了,這樣就能實時的減少一些不必要的通知,全天的告警查詢問題也更加的直接。

使用者也可以選擇序列降噪的方式,就比方說使用者的每天的監控每天產生的告警量較大,也明確部分的告警產生的邏輯,但是單一設定自定義壓縮規則所壓縮的效果又不是很理想,這時候就可以透過設定自定義壓縮規則和實時智慧降噪組合的方式,將自定義壓縮規則優先順序設定為1,實時智慧降噪的方式優先順序設定為2,這樣產生的告警,會先判斷是否滿足自定義壓縮規則,如果滿足就會按照使用者設定的規則進行壓縮,如果不滿足就會按照實時智慧降噪的方式進行壓縮降噪,從而讓告警壓縮效果達到最大化;同樣的,如果使用者一天的告警頻率不定,或者某時間段內的告警量激增,想看到激增的告警中,主要的告警有哪些,又想讓某些指標的告警特定壓縮通知,這樣就可以透過設定自定義壓縮規則和時間視窗智慧降噪組合的方式,達到一個最佳的理想效果,以上就是本次的智慧降噪方式的推薦,希望能給你帶來一些幫助吧~


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69948837/viewspace-2842615/,如需轉載,請註明出處,否則將追究法律責任。

相關文章