DevOps升級&AIOps落地,網際網路企業和傳統企業的做法有何異同?

資料庫頻道發表於2018-10-22

現有應用場景的不斷變化使得技術的更迭越來越快,不久之前,人們還在科普DevOps是什麼,但是如今DevOps已有英雄遲暮、日薄西山的跡象,AIOps正以蓬勃之勢邁入大眾視野。如何才能從DevOps走向AIOps?也許,這篇文章可以給你答案!

在《DevOps的升級&AIOps的落地,看看這些大廠都是怎麼做的?》文章中,我們看到了一些網際網路公司的實踐,但技術分享一篇文章怎夠?本文將接著為大家解析更多的網際網路公司是如何實踐的,另外,作為獨家彩蛋,我們也徵集了傳統企業在這方面的應用實踐。

田文博:美團點評外賣配送穩定性保障系統智慧化探索

有媒體曾總結過現代人的生活方式是“吃飯靠外賣、逛街靠網購、生活靠機器”,相信每個點外賣的人都曾使用過或者聽說過美團點評,但是卻很少人知道美團點評背後的技術。這次,美團點評高階技術專家田文博受邀參加第十屆中國系統架構師大會,難得和我們分享了美團點評外賣配送穩定性保障系統的智慧化探索。

美團點評外賣業務的高速發展,使得外賣履約環節的即時物流在業務規模和複雜性上也隨之快速膨脹,即時物流的業務特點決定了上下游對於故障非常敏感,以往靠人肉來進行業務運維的模式已經無法滿足其對於穩定性的要求,因此美團點評構建了針對即時物流的穩定性保障平臺,將穩定性保障的手段進行有效的串聯,從而提升運維的效率。

穩定性保障平臺主要圍繞防範、發現、定位和恢復這4個階段進行建設,在防範階段可以透過服務日常巡檢發現風險點、透過發版檢測減少上線事故、透過全鏈路壓測發現服務瓶頸,在發現階段基於異常檢測快速發現故障對業務的影響,在定位階段基於縱向和橫向維度的異常分析快速定位導致業務故障的根因,恢復階段根據定位的根因快送觸發預案進行止損和恢復,透過4個階段的有效串聯,可以幫助我們達到以下目標:防範可能出現的穩定性問題和快速解決線上故障。

魏家富:美圖公司智慧化運維實踐

隨著人工智慧技術的高速發展,越來越多的業務場景開始逐漸引入並融合使用,例如現在很火很熱的AIOps。但AIOps適合所有的企業嗎?不一定,美圖運維總監魏家富提出要落地AIOps時我們要思考以下幾個問題:

  • 我們有哪些場景可以智慧化?(監控、業務預測、平臺流程 etc..)

  • 我們真的有足夠的資料可以支撐機器學習、資料訓練嗎?

  • 我們真的可以大範圍專案推廣並得到接受和認同嗎?

而美圖選擇落地AIOps,是因為其運維受到了多種挑戰,系統不斷演進,規模、業務複雜度、變更越來越頻繁;資料中心拓撲不斷擴大,網路新技術不斷引入;軟體規模、程式語言、協議棧及各系統調入關係、變更逐步增大……在這種情況下,美圖技術團隊研發了智慧運維機器人。

據魏家富介紹,美圖的智慧運維機器人主要負責兩方面的工作:移動化辦公和基礎支撐系統智慧化。其中移動化辦公包括帳號、許可權類操作,機器裝置資訊、執行狀態檢視、互動和日常運維操作;基礎支撐系統智慧化包括IT場景智慧應答。

付正全:京東物流大規模智慧監控的思考與實踐

大家都說“IT運維難”,那麼到底難在哪裡呢?京東物流架構付正全表示IT運維的困難主要體現在以下方面:運維人數不變,管理機器數翻倍;機器數量和網路環境變化頻繁,網路拓撲日益複雜,資源雲化,虛擬資源頻繁彈性伸縮,不可靠的CMDB;運維從業者減少,運維專家匱乏;運維平臺日趨複雜,缺乏統一規劃,企業內部監控/運維繫統繁多,形成資料孤島。

2016 年,Gartner 提出了 AIOps 的概念,並預測到 2020 年,AIOps 的採用率將會達到 50%。簡單來說,AIOps 就是希望基於已有的運維資料(日誌、監控資訊、應用資訊等)並透過機器學習的方式來進一步解決自動化運維沒辦法解決的問題。

京東物流的AIOps建設思路也是比較清晰明確的,從發現問題到解決問題再到規避問題,具體對應到每個層級,大家可參考上圖。

孫杰:大型企業智慧運維的探索和實踐

終於到了我們期待的彩蛋環節,本專場我們邀請到了從業十幾載的IT老兵、中油瑞飛資深架構師孫杰和我們分享他對智慧化運維的思考。

目前傳統運維存在的突出問題包括,資料分散,不利於故障分析和問題跟蹤;要的功能沒有,沒用的資料重複採集,影響正常業務;採購多種運維軟體,在功能上、裝置上存在投資浪費,沒有減輕運維壓力,還增加多種軟體系統的維護工作。

如何解決這些問題呢?那就需要建立現代化、智慧的運維管理模式:

1. 網路、系統、裝置、設施實行集中監控、集中IT支撐、統一執行排程;

2. 建立自維和專業外包相結合的運維模式、參考國際標準體系建立國內領先的運維服務規程;

3. 建設智慧集中監控運維資訊化平臺,提高自動化水平,減少監控人員,減少運維支援。

4. 建立降本增效、綠色節能、全成本核算的效益管理模式。

5. 元件掌握網路、動力、安消防、IT軟硬體等核心專業技術的運維支撐隊伍。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31545814/viewspace-2217162/,如需轉載,請註明出處,否則將追究法律責任。

相關文章