要用“+智慧”強身健體,“心臟”做好準備了嗎?

naojiti發表於2019-04-01

今年的《政府工作報告》中,首次寫入了“智慧+”相關命題與討論。這一國家政策方針,指明瞭智慧技術必須與產業結合,進入生產核心領域,才能達成為現有經濟體解放生產力,提高生產效率的目標。

而“+智慧”的實現,也為各行各業和服務於全社會的ICT基礎設施提出了新的挑戰。當智慧化浪潮襲來,各行各業都將提出對計算的新應用、新場景和新需求。而為了應對這些變數,其實還有大量棘手的問題需要解決。

其中最關鍵的問題,來自算力。

根據OpenAI統計,從2012年到2018年,全球對AI算力的需求提高了30萬倍,而算力供給卻遠遠不足。而在普遍的算力飢渴中,最急待升級的算力輸出口,應該就是資料中心。

我們知道,在今天這個大資料時代,最主要的計算和儲存都已經發生在了資料中心當中。資料中心就像整個計算世界的心臟,供給著所有計算相關的資料血液流動,驅動ICT產業正常運轉。

如果說+智慧是一套新的武功,那麼能不能快速將其融會貫通,很大程度上將取決於習武者是否有一顆“大心臟”。否則剛練了沒幾下,心臟供血先不足了,那豈不是自討沒趣?

為了練就智慧計算時代強大的“心肺功能”,需要解決哪些問題?

據瞭解,從成立以來就接連有大動作出手的華為智慧計算業務部,接下來將把目標對準計算世界的中央:資料中心與架設其中的伺服器。那麼不妨借這個機會,讓我們先來了解一下,資料中心這顆計算世界的心臟,在今天到底面臨著哪些問題。

計算需求在提速,資料中心跟得上嗎?

在雲端計算和網際網路帶來的通用計算時代,資料中心實質上也就是全球計算系統的中樞。

1978年,英特爾推出了8060中央處理器,同時釋出了x86指令集架構。此後,這一指令整合為了通用計算時代的代表。而隨著計算需求日益龐大,網路傳輸能力日益增強,計算產業開始進行更加整合化的計算處理模式。於是就產生了集中計算、集中儲存的資料中心模式。而基於x86指令集的計算伺服器,依舊是傳統資料中心的主要構成體。

然而隨著技術的不斷進步,資料中心也開始承擔越來越多的壓力。比如說影片和影像任務開始越來越多,AI更是提出了完全不同的、基於多層神經網路的運算任務需求,這些計算任務僅僅使用通用CPU計算,其效率會越來越差。

而隨著對AI等智慧計算任務的需求量大幅提升,相關資料呈現爆炸趨勢,各行業開始產生不同的計算與儲存要求,這就讓傳統資料中心更加難以負載。

總體來說,這個問題有兩種解決方案,一就是興建更多大型資料中心,但這個顯然不能作為絕對方案,二就是對現有資料中心,尤其是其使用的伺服器進行智慧化升級,讓資料中心跟上智慧時代的進化需求。

總體來說,資料中心的升級要解決兩個宏觀問題。

首先當然是針對影片影像、神經網路等新需求的算力提升,擺脫過度依賴CPU的歷史。讓算力供給充沛,把昂貴的算力成本降低,讓算力適應新的計算需求。

其次,是對資料中心的運維管理進行升級。今天隨著資料中心的處理資料越來越多,裝置體系越來越複雜,已經陸續出現了“建得起,管不起”的現象,以至於人力根本無法承受資料中心運維任務的複雜程度加速。

此外,大型資料中心還在變成新型的“電老虎”,而其實飽和製冷模式要浪費大量的能源,這也是資料中心需要重新審視的問題。

由以上邏輯可以看出,資料中心的智慧時代升級,主要需要解決兩方面問題:內在的伺服器迭代,以及運維場景的全域性進化。

智慧計算的新需求:伺服器本身的升級空間

讓我們先來看看第一個問題,資料中心伺服器在今天要進行哪些升級進化?

AI的到來,事實上對計算提出了一個體系化的考驗。比如說在自動駕駛場景中,訓練計算需要處理影片和影像,這就需要對影像任務進行處理的針對性算力。然後還要擁有深度神經網路等AI演算法的專項加速能力,確保訓練效率可以達標。而在自動駕駛訓練過程中,資料吞吐量是異常龐大的,網路需求和儲存需求也都較網際網路任務有著指數級提升。

一般來說,在智慧計算的任務需求下,伺服器被要求進行三個方面的能力進化。

1、效能更強,相容性更好的異構計算能力,能夠適應不同資料型別的大規模處理。

2、強大的網路處理能力,能夠融合不同網路協議,確保低時延、大流量的網路傳輸。

3、資料吞吐能力進一步升級,對主流資料庫有更好的效能加持。

伺服器可以說是資料中心的核心,核心算力的進化才能確保智慧進化準確完成。然而另一個角度看,資料中心本身也是一個不斷複雜化的場景。資料中心的運維與節能,對於整個計算產業來說也是至關重要的。

大資料,大中心:大規模部署場景的進化

如果我們把資料中心看作一個工廠,就會發現今天這間工廠,正在經歷從傳統工業的粗放型增長方式,逐步過渡到精細化、自動化增長方式的過度。

比如說,為了提高算力,資料中心普遍都在經歷越建越大的變化過程。不斷增多的伺服器,海量彙集的資料和儲存卡,意味著資料中心本身在變得越來越複雜。這種趨勢發展下去,將會面臨兩大問題,一是運維工作的複雜程度,很快將超過人工所能負載的極限;二是龐大的資料中心場景意味著飽和式製冷,將消耗過量的資源。

這兩大問題的出現,要求資料中心自身的服務系統進行更多進化。總地來說,資料中心場景正在呼喚“四個進化”:

1、運維進化,降低人工干預次數以及運維難度,推升利用智慧技術解決運維問題的解決方案,讓複雜的運維變得簡單易操作。

2、智慧伺服器部署與軟體管理,對資料中心軟硬體部署和管理實現整體最佳化,減少高頻次重複勞動。

3、自動診斷和修復,運用機器學習技術主動發現故障源,快速排查,機器自動修復,降低伺服器故障率。

4、功耗管理邁上新臺階,將伺服器的耗電與製冷需求進行連線,實現資料中心L1與L2的聯動。達成低功耗低能耗的目標,降低資料中心整體用電。

這四個進化,意味著資料中心的進化方向,也是ICT產業本身實現智慧化的標誌之一。

醞釀“大心臟“的華為

去年年底,華為成立了智慧計算業務部,開始將智慧計算產業作為整體需求,針對不同的計算需求與業務場景,提供相應的智慧計算解決方案。

迄今為止,華為智慧計算業務部發布了Atlas人工智慧計算平臺(包括Atlas 200 AI加速模組、Atlas 300 AI加速卡、Atlas 500智慧小站和Atlas 800 AI一體機)、智慧駕駛計算平臺心MDC 600、關鍵業務伺服器KunLun V5等產品和解決方案,而下一步的重頭戲,則很有可能聚焦在資料中心與伺服器,這個智慧計算的核心場景中。將目前x86系列產品中的主打產品,FusionServer伺服器進行進一步升級。將資料中心在今天可能面對的內外兩個系統問題、多種升級阻礙一網打盡。

為醞釀一顆“大心臟”,迎接智慧時代的快速到來,華為將在智慧計算話題中給出哪些新的答案?讓我們一同期待4月3日的釋出會吧。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2640043/,如需轉載,請註明出處,否則將追究法律責任。

相關文章