弘積科技SuperSR:讓業務系統擁有自愈能力

玄學醬發表於2018-03-20

20170710124221265.jpg

隨著業務的增長,伺服器數量不斷增多,IT運維壓力也逐漸增大。各種軟、硬體故障而造成的業務中斷,已經成為資料中心管理者的噩夢。

“我們觀察到,越來越多的使用者投入大量的人力精力到運維和管理中,已經達到所能承受的極限了。尤其是一些金融、政府行業的使用者,以及高校和醫院,所擁有的業務系統很多,但是資訊中心的人手非常不足的,導致沒有辦法實時監控到業務的狀態。” 弘積科技技術總監邢韜表示。

不過,傳統網路管理平臺的監測關注點仍在於硬體裝置的狀態以及網路流量的狀況,而並不在於應用層。因此,往往無法從業務層面進行更有效地監測和管理。

對於這些使用者來說,亟需一個更智慧、更自動化的網管解決方案,來釋放IT人手,快速有效地監控、管理系統和網路。

弘積科技全新的SuperSR業務自愈方案由此而生。作為國內第一個關注於應用層的網路管理產品,SuperSR能實現對應用系統進行全面而深度的後臺監測,並智慧、自動地進行業務恢復。

“SuperSR可以實時監控系統中的業務狀態,一旦監控到異常,會自動地進行恢復性的嘗試,來恢復出現故障的業務系統,通常可在1-3分鐘內可使業務自愈。”

利用可程式設計指令碼模擬使用者行為

20170710124341318.jpg

目前,弘積科技的SuperSR業務自愈方案已經在金融、政府、教育、醫療等行業進入落地階段。

據悉,SuperSR的執行機制是通過可程式設計指令碼自定義探測行為,從而模擬使用者對於業務的資料訪問需求,以及模擬管理員的恢復操作,可以幫助95%以上的業務系統實現自愈。

“就好比有一個虛擬使用者全程模擬各種業務應用的請求,通過判斷伺服器的答覆是不是和預期一致,從而監測業務狀態。不論應用是什麼樣的,我們都可以根據應用特點來構建相應的指令碼或者說資料包,來模擬使用者的訪問行為。一旦訪問出現了異常,就會從使用者切換到管理員視角,通過模擬管理員的操作手段,觸發業務恢復動作。”

對於管理員來說,這些業務探測和恢復的行為都是自定義的,可以根據當前的系統狀態,靈活選擇是否自動恢復。

“要進行恢復操作的時候,系統會向管理員進行確認:現在發現問題了,是否要嘗試進行這種業務恢復?如果管理員判斷當前時間點不適宜,可以只看到告警,不進行操作。”

在今年釋出的最新版本中,弘積科技SuperSR業務自愈方案增加了微信端推送功能,第一時間把告警推送到手機端,讓管理人員哪怕在度假、出差過程中都能進行處理。

“告警通過微信平臺公眾號進行推送,管理員可以在微信上控制裝置,進行業務恢復。哪怕在高鐵上,只要手機有網、有微信,就能知道這個伺服器是否出現問題了,並在出現問題的時候,確定是否要進行自愈恢復。”

願景:AI與SuperSR的結合

20170710125222617.jpg

此外,SuperSR業務自愈系統還定期提供伺服器執行狀態報告,把業務伺服器的執行狀態進行彙總,讓管理員更加方便地瞭解系統的執行情況。

“根據一定的時間段,比如說一個月,形成伺服器執行狀態報告。某臺伺服器在哪天幾點幾分出現了故障,不管是網路不通了,還是當機了,都會以報告的形式傳送到管理員的郵箱。這樣,管理員直接從這份報告就能瞭解這一個月伺服器的執行情況。要是伺服器在某個時間段頻繁地出現問題,就能通過報告判斷究竟是哪方面的原因。”

在談到未來IT運維管理的前景時,邢韜認為,在人工智慧和大資料的趨勢浪潮下,讓機器自主深度學習,理解業務需求,從而把重複的人力維護工作轉移給智慧化的網管裝置,會是一種探索方向。

“目前我們還是通過人工預製好的指令碼,來判斷業務狀態的正常與不正常。隨著人工智慧的發展,有一天也許可以完全拋開人力,通過機器學習,讓產品能理解網路和應用,自主學習什麼樣的狀態是正常的、什麼樣是不正常的。這樣,就能真正擺脫目前繁瑣、重複性的大量人力勞動,實現更靈活、更高效的管理。”

本文出處:暢享網
本文來自雲棲社群合作伙伴暢享網,瞭解相關資訊可以關注vsharing.com網站。


相關文章