AI時代需要的網路,跟過去有什麼不同?

naojiti發表於2019-01-09

最近產業中最愛玩的一個遊戲,就是“AI在哪”。以往我們能看到AI存在於實驗室內、存在於軟體之中,但想要讓AI從模型走進現實,往往沒那麼容易。最起碼的,AI任務需要一系列條件去支撐,其細節建立在各種ICT基礎設施的迭代之上。或許可以這樣比喻,AI就像汽車,當它到來時,配套的高速路加油站修車廠都要建好。馬車時代的路況,是無法發揮汽車任何優勢的。

AI走到現實的重要條件有很多,尤其需要注意的是,AI必然建立在ICT基礎設施之上,透過網路空間延展到萬物智慧應用當中。可以說,AI的運轉與網路環境息息相關,網路是AI的行軍之路。然而在AI的兵馬到來之際,網路環境這條運兵棧道真的已經修建好了嗎?如果我們分析一下今天AI面臨的“網路路況”,會發現其中孕育著很多痛點。同時,一個智慧時代的產業機遇也蘊藏其中。

AI時代的前夜,網路表示“壓力山大”

我們相信AI時代會在明晨到來,那麼今天就是AI時代的前夜。

這個漫長的前夜裡,AI應用正在為ICT基礎設施提出越來越多的挑戰。

首先AI運算相比以往的運算更加複雜,一次智慧化識別的背後可能包含著幾百個模型的計算。能夠承擔更復雜的運算任務,顯然是AI應用ICT基礎設施的第一要務。

同時AI運算往往關乎於影像、關乎於影片,其資料量的龐大程度相比以往實現了從線性到張量的躍進。能承擔更大的資料透過量才能讓AI應用平穩執行。

最後AI運算對於ICT基礎設施的部署條件要求也更加嚴苛,以往乙太網1‰的丟包率,對於AI應用來說會極大的影響其算力發揮。

這些AI給計算和通訊帶來的改變,同時也給通行的網路環境施加了巨大的負擔。無論是智慧駕駛這樣的巨大資料量任務,還是工業網際網路精準的演算法模型部署要求,或者AIoT駁雜的運維壓力,都給網路環境新增了無數壓力。

面對AI的到來,網路環境的痛點可以體現在這樣幾個方面:

1、龐大算力需要和複雜的異構計算,需要彈性的網路環境支撐,網路速度跟不上,AI算力也就無的放矢。

2、AI任務要求大規模部署和平行計算、海量非結構化資料透過、實時學習、演算法在框架層和應用層的精準度一致等等。這些新要求是此前的網路環境中所不具備的,需要新的主動網路最佳化能力。

3、AI時代,企業業務空間增長,並行資料量暴增,直接導致運維工作太過複雜,解放這一壓力,也已經刻不容緩。

這三大痛點之下,直接的結果是網路交換機市場迎來了全新的挑戰,同時也是市場迭代的深刻機遇。具有AI支撐能力、智慧運維能力的次世代網路交換機,成為了今天AI大局中的當務之急。

引入CloudEngine 16800作為華為AI發展戰略以及全棧全場景AI解決方案中的新成員,透過創造性地在交換機中安裝AI晶片,透過智慧最佳化和本地決策獲取自動駕駛網路能力。加上單槽48 x 400GE高密埠,可以最大化支援AI運算的高密度流量,把網路環境建設推向了AI時代的新層次。

CloudEngine 16800背後,華為解決了AI前夜的兩個重要問題:讓現在簡單,讓未來通順。

更簡單的今天:用AI之力扭轉網路運維困境

分析透過安裝AI晶片,CloudEngine 16800首創在交換機當中新增AI算力,在裝置層面整合了智慧化的主動識別和實施決策能力。在這種能力之下,可以實現秒級故障識別和分鐘級故障自動定位。

而這一功能為應用者帶來的第一個改變,就在於將可以用AI的智慧來完成運維工作,將今天與日俱增的運維壓力釋放出來。

用AI來承擔原本耗費大量人力,並且逐漸已經無法為人類所完成的網路運維工作,可以看作幾個梯段達成的目標。

在CloudEngine 16800的AI引擎解決方案中,首先完成的是智慧診斷的本地化,透過CloudEngine 16800的本地推理和實時決策,用AI承擔運維工作,減少對雲服務診斷的依賴,實現低成本高效率。

接下來,基於智慧化運維和故障檢測,以及專業故障庫的智慧匹配,達成故障主動排查,主動監控的能力。將人工難以完成的複雜網路運維監控承擔下來。

此外,透過智慧運維平臺和交換機本地智慧構成的分散式AI運維架構的配合,實現故障快速自我修復,完成從本地分析到自我癒合的完整AI網路運維體系。整個網路系統開始接近“自動駕駛”狀態,將使用者從不斷複雜的網路運維中解放出來,從而更加關注場景和應用,而不是消耗大量人力物力在後勤保障上。當以往的困境被改變,整個網路運維繫統的靈活性和可部署性也會隨之提高。過去傷筋動骨式的維修、擴充套件將不再重現。

換言之,在AI之力的影響下。交換機的應用模式會一改往日的沉重複,變得更加輕盈、更加簡單。

智慧最佳化之下,更多想象力的未來

對於網路環境來說,今天更大的任務是要適應企業使用者不斷增大的AI算力需求,以及衍生的網路依賴。網路環境必須為AI任務大量普及,提供必要的網路支援。不能等到資料氾濫,深度學習應用迫在眉睫,才發現原來路還沒鋪好。

基於AI晶片帶來的主動分析能力和實時學習能力,CloudEngine 16800應用上了華為獨創的iLossLess智慧無損交換演算法,提供網路結構最佳化和全網排程能力,滿足複雜AI任務在執行時需要的網路空間。這一能力對於AI開發者和運用者來說,將針對未來越來越廣泛的AI需求,解決三大底層問題:

1、 解決乙太網原生短板的丟包問題,提升AI任務精度以及場景一致性。應用上智慧無損交換演算法後,可以讓乙太網實現零丟包,充分發揮AI算力,不會在從任務到場景的過程中產生誤差。

2、透過靈活的網路排程,加速AI任務訓練,加快模型部署效率。同樣在智慧無損交換演算法下,資料中心可以根據流量模型實現自適應和自最佳化,根據應用狀況自主進行資源排程,更加適應AI應用流量彈性空間較大的特徵。

3、基於AI開發平臺,讓IT人員更好的加入AI,從另一個維度降低開發成本,最終實現AI快速低成本落地。這種更加普惠的模式,在企業進行智慧化轉型時,提供了強大的推助力。

AI時代,並不只是演算法的時代,同時也是滿足於AI執行,能夠把AI效能最大化的系列技術共同的時代。

此刻我們需要的不僅僅是AI技術本身的發展,還有一切與其相關技術的合力前行。其中,網路基礎環境就是至關重要的一項。新一代的網路產品,必須比等待中的產業格局走到更前面。而在產業智慧化轉型的革命征程中,網路產品絕非是在基層供給燃料的後備軍,而是要充當起先鋒和開路者的角色,才能讓這條漫長的征程走得更加順遂。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2375326/,如需轉載,請註明出處,否則將追究法律責任。

相關文章