週五之後,AI風起,雲天變

naojiti發表於2019-08-27

上週五,華為“週五見”達成了刷屏級的效果。

其實一直關注我們的朋友,或許在此之前就不難推測出,華為如此鄭重的“週五之約“,應該是要釋出去年HC大會中已經披露定位和規格的昇騰910晶片。

果不其然,華為輪值董事長徐直軍在上週五發布了這款屬於Ascend-max系列、號稱地表最強算力的AI晶片。一時間關於AI、關係晶片的話題又重回大眾視野,提振了社會心氣。

對於昇騰910這個名字,AI愛好者可能已經不再陌生,那麼我們接下來的問題或許應該是,“週五”之後怎樣?換句話說,大家都已經從各種資訊渠道瞭解到,這此釋出的昇騰910是華為的AI大招,目前世界上最大算力的AI晶片。

但或許大家會好奇,這個大招對產業,對你我有什麼價值?它的能力將如何投放給廣闊的企業智慧市場需求?

所以在“後周五時代”,或許有必要進入昇騰910背後,窺探這片多米諾骨牌的釋放,可能會在AI與計算產業中引發連鎖反應。首當其衝受到影響的,必然是公有云市場。

昇騰910落地後,AI之風正向何處奔湧,雲端計算產業會蕩起哪些漣漪?這是一個值得花費我們更多時間來思考的話題。

雲與AI之變

瞭解昇騰910的產業價值之前,我們必須回顧雲端計算產業近幾年在遭遇怎樣的變化。

我們知道,從2012年到2018年,全球AI算力的需求增長了30萬倍。而今天隨著AI算力從科研與開發走向產業應用,這個曲線更加筆直地向上攀升。

深度學習為代表的第三次AI崛起,基礎技術邏輯是以某一目標訓練演算法模型,然後進行推理部署,達成所期待的耦合效果。

這就意味AI應用的流程包括訓練和推理兩大部分。企業想要獲取AI技術,要麼自己訓練,要麼使用廠商提供已訓練好的AI能力。

而無論是AI的訓練、開發,還是能力呼叫、場景部署,都是建立在計算基礎上的。而且AI任務本身需求大吞吐量、高併發、高延展性的算力,所以雲端計算是AI效率最高、貼合方式最緊密的主要算力提供方案。

這一點帶給雲端計算產業本身以非常強大的變化。過去雲端計算的價值,更多是對已有網際網路任務進行支撐,而現在雲端計算成為了獲取AI能力、開發AI能力的主要載體。從“支撐”到“獲取”,這完全改變了公有云對於客戶和市場的價值。

於是我們看到,AI開始作為雲端計算廠商的主要增長點。今天全球雲端計算市場的主要趨勢,是傳統老大哥AWS正在增速放緩,今年第二季度其增速有史以來第一次低於40%。而從去年開始大規模重組整合,以一系列AI能力、AI工具,以及部署靈活性為賣點的微軟Azure,異軍突起以極快的速度成為第二,雲+AI成為了微軟最賺錢的生意。為了繼續鞏固這一優勢,不久前微軟十億美元投資了OpenAI,意在與谷歌持續競爭未來的AI市場。

而以AI演算法能力著稱,坐擁TPU和TensorFlow框架的谷歌雲成為第三,今年穀歌預計在雲端計算業務營收超過80億美金,這將成為谷歌體系的最重要增長點。

而在國內市場,以AI技術著稱的百度雲、華為雲成為了崛起最快的兩朵雲。不難看出的是,全球公有云市場中,AI正在成為當之無愧的王牌。AI能力的強弱,也在成為雲增長的核心能力標準。

那麼什麼是雲+AI的核心能力呢?

從歐美雲巨頭的發展軌跡看,專項AI算力、框架、能力、開發生態是構成雲服務商與企業AI需求結合的四大聯接點。

而其中算力與框架,又是整個體系的支撐,是讓使用者可以自行研發AI模型的基礎,價值格外重要。比如谷歌雲這兩年的快速增長,其實是以其自研的訓練用AI晶片TPU為核心戰略,再將開發社群和TensoFlow的使用者捆綁到自己的雲服務中,達成短期快速增長。

而為了應對谷歌樹立的AI開發者之牆,微軟、Facebook等巨頭聯手打通旗下開發框架,併發布了ONNX等跨框架工具。

由此可見,專項訓練AI算力和開發框架,是如今構築雲端計算企業未來增長點的核心。而華為釋出昇騰910以及自研框架MindSpore,最直接受惠的當然就是直接應用其價值的華為雲。由於業界其他雲端計算廠商都使用英偉達的板卡作為AI算力來源,所以華為雲即將成為谷歌雲之外,唯一擁有自研訓練晶片和自研框架的雲服務廠商。

這意味著晶片和框架這場雲+AI的國際頂層競爭裡,加入了華為雲的坐席。而華為雲在昇騰310和邊端場景的應用佈局,甚至構成了比谷歌雲更加完整的全棧AI能力。這一資訊背後,預示著此刻已經風起雲湧的雲端計算產業,必將更加不平靜。

在明晰了雲+AI的產業格局之後,我們需要換個角度,從企業使用者的視角看看,昇騰910與華為雲的結合,到底將帶來什麼價值。

針對AI訓練的暴力計算,是不可或缺的產業基石

對於AI技術的應用者來說,AI分為兩個部分,也就是大家熟知的訓練和推理。這二者之間的關係就像培養一個人。訓練就像上學接受教育,推理就是開始找工作。

每個人都知道,換下工作比較容易,學校教育上個若干年可就成本很高了。不僅是要磨練學生,更是考驗家長和老師。對於AI來說也是如此,企業使用者應用AI能力並不難,但是想要自己訓練一個專屬的深度學習模型,把AI變成自己的專有競爭力,那可就困難了。

其中最困難的一項,就是訓練專項算力不足。我們曾經採訪過一位科研界的朋友,他設計了一個深度學習應用於生物醫療領域的演算法模型。但是用研究所採購的專項算力,申請一次四個月,訓練一次兩個月,出了錯誤就重來。這種算力情況,直接導致他到畢業也不可能完成研發。

大型深度學習模型訓練,是耗時、耗能、消耗算力最大的AI開發環節,但這一環節也是AI開發與創新的基礎。如果企業使用者和開發者不能獨立訓練大型模型,那麼AI將永遠停留在表層應用,無法產生差異化創新與深度結合行業的應用。

而解決方案也很簡單,用徐直軍的描述,就是對AI訓練進行暴力計算。只用當AI算力強到一定程度,用不講道理的姿態碾壓資料訓練,AI才能真正被千行萬業應用,成為眾智創新的新高地。

目前來看,昇騰910晶片就符合“暴力不講道理”的這個晶片“人設”。根據公佈資料,測試結果表明昇騰910算力達到了半精度 (FP16): 256 Tera-FLOPS;整數精度 (INT8) : 512 Tera-OPS。並且合規算力所需功耗僅有310W。更直接的對比是,運用在實際AI訓練任務中,在典型的ResNet-50 網路的訓練中,昇騰910與MindSpore配合,與現有主流訓練單卡配合TensorFlow相比,顯示出接近2倍的效能提升,每秒訓練的圖片數量從965張提升到1802張。

或許我們可以說得更直白一點,華為所指的主流訓練單卡,就是英偉達的V100。事實上,目前能夠基於雲服務獲取的AI訓練算力,只能來自谷歌的TPU和英偉達的V100。後者基本要通過亞馬遜的AWS來獲取。而根據英偉達方面的指摘,TPU2.0僅有V100二分之一的算力,並且限量出租。

於是我們能看到,基於雲服務的AI訓練算力是十足的稀缺資源,價格昂貴且難以預約。這樣的產業條件,顯然是無法促進AI行業真正向前發展的。

而現在,昇騰910部署到華為雲之後,全球開發者擁有了第三個選擇,中國公有云市場迎來了首個全棧雲+AI解決方案。加之昇騰910算力比V100更強,華為雲始終堅持普惠定價策略和充足能力供給,訓練這個天梯,或許真正能夠擁抱算力層的解決方案。

雲服務+AI訓練算力,是一顆名副其實的產業基柱。但是通往這個基柱的走廊,過去非常狹窄——企業和開發者要忍受各種成本限制,當昇騰910接入華為雲,這個走廊瞬間被拓寬,甚至開啟了一條全新通衢。

從廣泛佈局企業EI,到昇騰310和ModelArts的應用與生態建設,直到今天迎來昇騰910和MindSpore,華為雲的產業智慧化賦能能力,也迎來了質的提升。

補完AI重器,華為雲凝鑄產業賦能三叉戟

順著昇騰910的產業邏輯再往下看,會發現華為雲即將獻給市場的差異化能力,是全鏈條、無相容成本的AI培育。

AI訓練算力對於雲服務之所以重要,一方面是因為它本身對應著AI產業發展中的重要需求,另一方面,它也是全棧AI鏈條中極重要的上游支撐。當昇騰910被應用於華為雲體系,華為雲也就具備了完全基於達芬奇架構,提供從訓練、開發到場景部署和體系化應用的全面支撐。

在AI能力部署領域,華為雲已經基於昇騰310晶片,提供影像分析服務、OCR服務、視訊分析等服務,有超過50個 API基於昇騰310,日均呼叫量超過1億次,並且在快速增長。

在開發者使能領域,華為雲基於ModelArts開發平臺,為AI開發者提供全流程的模型生產服務,打通、覆蓋了從資料獲取-模型開發-模型訓練-模型部署的全鏈條,ModelArts已經積累超過3萬名AI開發者。

在場景推理部署和簡便開發之外,開始補完大規模AI算力,以及模型訓練的頂層環節,意味著企業使用者即將可以基於華為雲,完成從訓練-開發-推理-部署的全部生產到應用環節。這一鏈條的主要受益使用者,更多是自身有大量可訓練資料,並且要求AI技術滿足差異化、行業垂直化需求的企業使用者。

如果我們按照這個需求在市場中框定使用者,會發現補完昇騰910這個AI重器後,華為雲即將向三類客戶提供全棧AI賦能:

1、對AI研發有重度需求的網際網路企業、高科技企業,以及有AI創新渴望的科研機構、開發者。

2、需要訓練大量資料,並進行穩固部署,對AI安全有高度要求的大型政、企、研究機構。

3、對行業AI能力有深度研發、訓練需求的傳統行業+AI場景,其中尤其以工業場景為重心。

在公有云市場競爭激烈的今天,這三種客戶很可能構成接下來華為雲的企業智慧三叉戟,從而撬動人工智慧成為社會生產力,實現真正的普惠AI。

偉大的咖啡機:從全棧AI到普惠AI之路

以上所說,或許可以看作昇騰910晶片與華為雲的短期改變與目標。如果我們把視線拉長,或許可以來回答這樣一個問題:晶片和框架這些基礎設施,挑戰如此之多,為什麼華為依舊堅持要做?

不知為什麼,今天華為雲對AI所作的一切,讓我想起了一種我們已經習以為常的裝置:咖啡機。

千萬別小看這臺機器,把咖啡從研磨到煮沸、沖泡的全流程,整合在一臺裝置裡,是人類非常偉大的發明。它改變了咖啡原本的製作規則和製作門檻,讓咖啡隨手可得,咖啡館開遍大街小巷。

口味更多、等待時間更少、操作更簡單,咖啡機讓這種飲料真正普惠化了——甚至從一種少數人的貴族雅好,變成提高社交效率和工作效率的生產力工具。

華為雲今天在做的,其實就是把研磨、沖泡等各種AI流程,集中在公有云這臺裝置裡。讓開發者和應用者不需要去三大街磨咖啡豆,五大街請人幫忙煮咖啡,再回家花三天三夜等待——而整合的前提,是每一項關於AI咖啡的能力必須完整。

這個完整度,也就是華為所說的全棧AI,是指包括晶片、晶片使能、訓練和推理框架和應用使能在內的全堆疊方案。具體到軟硬體體系,華為全棧AI包括:基於統一、可擴充套件架構的系列化昇騰晶片和IP;晶片運算元庫和高度自動化運算元開發工具CANN;支援端、邊、雲獨立的和協同的統一訓練和推理框架MindSpore;開發者使能工具ModelArts,以及大量多層次API。

當這些能力和技術搭建成了完整可閉環的結構,華為雲才可能不斷壓縮其中的過度與相容成本,不斷迭代和提供更多能力。基於機械化高效率的AI咖啡,最終才能被端到千行萬業面前。

或許有人會好奇,在框架諸強林立的情況下,華為為什麼要做自己的框架MindSpore。答案在於,MindSpore主要努力方向是開發態友好和執行態高效,並且能適應端、邊、雲的不同場景。換言之MindSpore是一種強烈指向降低開發成本,提高開發成果可用性的深度學習框架,與華為云為開發者提供ModelArts平臺的思路一脈相承。

通過自研晶片降低成本,提升算力;基於開發框架和開發工具降低開發難度,提升應用效率;基於全棧架構降低相容門檻;基於全雲服務提供靈活可控、高整合度的AI基礎設施。最終的指向,是儘可能的成本壓縮與效率提升,讓AI從科研環境下的理論可用,轉化為工業生產環境下的產業可行。

徐直軍在昇騰910釋出會後回答記者時明確,昇騰會像麒麟一樣走向“不歸路”。換言之,全棧全場景AI能力將會不斷迭代滾動發展,這意味著華為雲將AI推向普惠的路,也是一條不達目標不會停下的路。

所以說,昇騰910真正指向的目標,是華為雲的普惠AI戰略,“+智慧,見未來”的決心;是使用者-雲端計算-AI能力之間的市場與服務重構;是AI門檻的規則改寫。

普惠AI任重路遠,山水迢遙自是題中之義。但基於華為的全棧全場景AI創造,雲+AI的基礎規則已經改變。

人類這種生物,從無在技術和生產力上退後的先例和可能。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2655199/,如需轉載,請註明出處,否則將追究法律責任。

相關文章