人工智慧是如何改變IT運維和DevOps的?

神棍先生發表於2017-10-30

要解決IT運維和DevOps團隊面對的挑戰,就是能夠在大量的日誌資料流中識別潛在的小的有害問題,這正是認知洞察力所做的事情。

  

  接下來的幾年裡,DevOps(開發軟體工程、技術運營和質量保障三者的交集)團隊和IT運維部門將面臨新的挑戰,不過這樣的說法聽起來不免有些多餘,因為他們本身最主要的責任就是要解決困難以及克服挑戰。

  隨著程式、技術和工具的顯著變化,應對這些問題已經變的越來越困難了。此外,企業使用者一直在向DevOps和IT運維團隊施加壓力,要求所有的東西都能通過點選應用程式來得以解決。然而,在後臺,處理這些問題完全是另一番景象,使用者無法體會發現一個問題是多麼的困難,更何況要解決它。

  當前IT運維和DevOps團隊面臨的最大的挑戰之一是能夠準確指出在他們工作環境中的大資料流中記錄的雖然微小但潛在的有害問題。換言之,這就像在草叢裡尋找一根針。

  如果你在一家7天24小時都線上的公司的IT部門工作,下面的場景聽起來或許很熟悉:你在半夜突然接到了一個電話,或許是某個怒氣衝衝的消費者,也或許是由於應用程式崩潰信用卡交易失敗而打過來的你的老闆,這時候你會立即去開啟你的膝上型電腦、開啟日誌管理系統,然後你會看到在設定的時間範圍內,有10萬條訊息已經被記錄下來了——一個人是不可能將這些資料逐條檢查完的。

  因此,遇到這樣的情形你會怎樣做呢?

  它是一個每一位IT運維專家都會面臨的故事,他們度過了許多個不眠之夜,他們在日誌條目的海洋中航行,尋找著觸發突發事件的關鍵點。這就是實時、集中的日誌分析發揮用武之地的地方。它能幫助這些人弄清楚日誌資料的基本面,並準確識別主要問題。通過它,故障診斷的過程變的就像在公園裡散步一樣簡單、有效,同時專家還能夠據此預測未來的問題。

  人工智慧及其對IT運維和DevOps的影響

  十幾年前,人工智慧還只是個炒作的概念,但現在已經被出於各種各樣的目的的人廣泛應用於各行各業了。結合大資料、人工智慧和垂直領域知識,技術專家和科學家已經能夠創造出驚人的突破和機會,這些以前可只能在科幻小說和電影中看到。

  隨著IT運維變得靈活、動態和複雜,人類的大腦已經不再能夠跟上大資料流的速度、體積和多樣性,這就使得人工智慧成為優化分析和決策過程中強大而重要的工具。人工智慧有助於填補人類和大資料之間的空白,提供給人類必要的操作智慧和速度,大大減輕了人類故障排除和實時決策的負擔。

  AI能幫什麼忙?

  在上述所有的情況中,有一件事情是共同的,正如討論一開始所說,這些公司需要一個解決方案,能夠幫助IT運維和DevOps團隊快速的從堆積如山的日誌資料條目中找到問題所在。要識別那條在你工作環境中增添麻煩的並使應用程式崩潰的日誌條目,如果你只是單純知道你的日誌資料出現了哪種型別的錯誤,是不是太簡單了些?當然它也會減少一些的工作量。

  一個解決方案是建立一個平臺,通過該平臺能從網際網路上收集各種相關資料、觀察人們如何利用類似的裝置來解決在他們的系統中出現的問題、以及通過掃描你的系統來識別潛在的問題。實現這一目標的一種方法是建立一個模擬使用者如何調查、監視和解決事件並且允許它低估人類與資料互動的方式而不是分析資料本身的系統。例如,這項技術可以類似於亞馬遜的產品推薦系統和Google的PageRank演算法,但這個是專注於日誌資料的。

  引入認知洞察力

  最新的一項技術實現了本文設想的解決方案,這項最近引起了很大反響的技術叫做認知洞察力。這種使用機器學習演算法的開創性技術能讓領域知識與日誌資料、開源儲存庫、討論論壇和社會執行緒相匹配。結合所有的這些資訊,IT運維和DevOps團隊可能從資料中獲取相關洞見,這其中可能包含著關鍵問題的解決方案。

關鍵問題的解決方案的概述

  實時的障礙

  DevOps工程師、IT運營經理、技術長、副總工程師和首席資訊保安官都面臨許多挑戰,但是通過將人工智慧整合到日誌分析和相關運維過程中,可以有效地減輕這些挑戰帶來的壓力。我們來舉兩個最主要的用例:

  •   安全

  分散式拒絕服務(DDoS)攻擊正變得越來越普遍,過去的目標只侷限於政府、知名網站和跨國組織機構,現在卻普遍開始針對知名人士、中小企業和中型企業了。

  為了避免這樣的攻擊,有一個集中的架構來識別可疑的活動並精確識別來自數千個資料條目的潛在威脅是非常必要的。因此,通過認知洞察力來抵抗DDoS進攻已經被證明是非常有效的。在過去,像Dyn和英航這樣的領先公司持續受到DDoS的攻擊,不過現在,已經有了一個成熟的、基於ELK的反DDoS攻擊策略,以阻止黑客的行動擊,並且能夠確保他們的操作安全以免受未來的攻擊。

  

認知洞察力從成千上萬個資料條目中識別到了潛在威脅

  •   IT運維

  在你所有日誌的每個條目都經過仔細的檢查及登記之後,把他們編譯到一個單獨的地方豈不是很棒?嗯,的確如此。您將能夠清楚地檢視流程表,並對來自同一個地方的不同應用程式的日誌資料進行查詢,這將極大地提高您的IT操作效率。

  要解決IT運維和DevOps團隊面對的挑戰,就是能夠在大量的日誌資料流中識別潛在的小的有害問題,這正是認知洞察力所做的事情。由於這個程式的核心是基於ELK的堆疊,所以它可以對資料進行分類和簡化,並且可以很容易地對你的IT運維進行清晰的描述。

  

快速找到IT工作中的“針”,並消除主要問題

  整合好的人工智慧可以帶來收益

  使用AI驅動的日誌分析系統使得在雜草中找針變得非常容易而且高效。這樣的系統將對整個組織的管理和運營產生巨大的影響。就像上面討論的公司的問題一樣,將AI與日誌管理系統整合在一起將會在以下幾個方面受益:

  •   提高客戶的成功率

  •   監控和客戶支援

  •   降低風險和優化資源

  •   使日誌資料可訪問效率最大化

  換句話說,認知洞察力和其他類似的系統在資料日誌管理和故障排除方面有很大的幫助。Rent-A-Center (RAC)是一家總部位於德克薩斯州的財富1000強公司,它提供了各種各樣的租賃產品和服務。它在墨西哥、波多黎各、加拿大和美國有超過3000家商店和2000個售貨亭,該公司嘗試整合兩種不同的ELK堆疊,但每天處理100GB資料過於麻煩,更不用提每天花在磁碟管理、記憶體呼叫、額外資料輸入功能和其他技術問題上的高昂成本和時間成本了。之後RAC轉向使用認知洞察,因此他們能夠檢測未來的異常,並使其能夠很容易地擴充套件不斷增長的資料量。他們是從這個管理著內外部ELK堆疊的專注的IT團隊中受益的一方。

  開放原始碼在資料日誌管理中的角色

  許多著名的供應商都在積極地研究和測試人工智慧,以提高日誌資料管理系統的效率。一些供應商如下:

  毫無疑問,ELK正迅速成為一種趨勢,越來越多的供應商在提供日誌解決方案。這是因為它已經成為企業避免花費前期鉅額成本而安裝必要程式的好方法了。它還具備一些基本的繪圖和搜尋功能,並且為了讓組織認識到他們日誌資料中存在的問題,他們會選擇諸如認知洞察力這種最新的技術,來快速找到“針”並消除主要問題。


相關文章