最強AI算力哪裡來?三個時代的阿里疊影

naojiti發表於2019-09-26

又是一年雲棲時。

阿里的雲棲大會,堪稱科技眾的年度狂歡之一。而今年似乎格外特殊,阿里雲十歲生日,阿里巴巴集團20週年,似乎都讓今年的雲棲有點不同。而從技術從業者的角度來看,或許另一個不同更加引人注目:被廣泛認知為網際網路公司的阿里,今年雲棲上唱主角的居然是一款AI晶片。

9月25日,達摩院院長張建鋒現釋出了“全球最強的AI晶片”——含光800。在AI行業目前被廣泛作為標準化測試的ResNet-50中,含光800推理效能達到78563IPS,重新整理了AI推理晶片的世界紀錄。

最強AI算力哪裡來?三個時代的阿里疊影

如果站在大眾輿論中看,或許我們很難把阿里和“最強AI晶片”這兩件事聯絡在一起。也許會認為其中充滿了反常識和突如其來。

但如果站在計算與智慧產業的時間迭序上看,或許會又對含光800抱有完全不同的看法:這枚最強AI芯,並不是阿里的轉型之作。反而阿里始終在踐行為產業提供最強AI算力的路上。平頭哥的第一次“雲棲秀”,則是這條路上自然而然醞釀的結果。

從雲到AI,阿里就像一位遊戲玩家,再每一個版本的副本中都拿到了關鍵道具。而在快速流轉的AI時代,這些關鍵道具組成了“阿里套裝”——作為產業底座的最強AI算力,就是這個套裝的加持效果。

從雲、大資料、演算法到晶片,雲棲的疊影凝固成了AI計算之路。

神奇AI算力在哪裡?

或許我們有必要先了解這樣一個理論:AI算力的差異化供給,究竟來自於何處?

去年5月,OpenAI 釋出過一份資料包告。其中提到自2012年以來全球AI算力需求在6年中擴大了30萬倍,AI產業的算力需求每3.5個月就在翻一番。

這個遠大於摩爾定律增長的需求裂變,意味著AI算力在這個產業週期裡必然面對大量供不應求的局面。這也就錨定了AI算力提供的第一條規則:雲是AI的最佳出口。

由於雲端算力天生具有能夠裁量提供的特點,這對於AI任務從訓練、測試到部署中廣泛面對的彈性增長、大規模並行部署、極端訓練用算力等幾大特點來說,具有難以取代的價值。瞬時性、併發性、彈力性,是AI對算力需求的基本面貌。

最強AI算力哪裡來?三個時代的阿里疊影

而在從雲到端、從訓練到推理、從部署到迭代的AI落地過程裡,我們可以看到AI算力的執行實際上受制於非常多的條件:計算架構、訓練叢集效能、框架對演算法的優化程度、部署環境等等都在影的響AI算力的最終實際體驗。這個漫長的流程,決定了AI算力的第二條規則:算力效能的優越與否不取決於單純的晶片,而是由從晶片、雲、資料處理能力、框架,再到演算法開發基礎、部署環境等一攬子條件來決定的整體閾值。

這意味著,AI算力不是一個單純的部件效能比拼,而是一個體系化工程,是產業技術疊加與AI基礎開發部署探索的完整序列。這意味著AI算力是一條路,這條路,需要不同時間的不同饋贈。

在時代收穫所需,這正是阿里雲的特點。

雲端計算時代,飛天的路標與饋贈

我們知道了AI算力來自哪裡之後,就可以來看阿里雲的收穫過程。雖然我們今天的焦點是平頭哥,但故事的開端其實早在十年前就已經發生。

2009年,草創的阿里雲寫下了第一行關於飛天的程式碼。當時這個“冒天下之大不韙”的團隊,就意識到大規模計算是未來網際網路的發展中軸,甚至是更多計算迭代的肇始因緣。

時至如今,這個判斷應該說已經被證明是正確的。阿里雲自研的飛天雲作業系統,已經成長位國內規模最大的計算平臺,可擴充套件至10萬臺計算叢集,單日資料處理量超過600PB。2018年雙11期間,阿里雲彈性計算能力累計超過1000萬核,相當於10座大型資料中心,創造了“脈衝計算”的新紀錄。雙11作為一個巨大的資料任務,某種程度上位飛天挺入智慧時代,成為計算底座提供了驗證。

最強AI算力哪裡來?三個時代的阿里疊影

AI計算的本質,是對異構計算和多樣性計算的需求。為此,阿里雲提供在雲服務市場率先提供了異構計算服務。構築了亞洲規模最大的GPU公共雲服務,並可在短時間內實現全球最大規模的GPU伺服器呼叫,超級GPU計算叢集支援每秒10億次AI峰值計算。此外,阿里雲還最早釋出了FPGA雲服務。

這些基於雲服務提供的大規模計算和異構計算,可以看作阿里雲最早投身公有云事業,在產業草莽期積累的時代饋贈。雲端計算的支柱能力和多元架構囊括,是產業AI所需算力的基本構成。這層疊影成為了阿里雲提供AI算力的底色,是一切故事的起點。

而在AI逐漸併入產業視角時,坐擁強大多元的雲,讓阿里可以更凶猛投身這個新的產業紀元。

AI探索時代,向實而生的阿里三叉戟

假如說,十年之前是公有云時代的崛起;那麼從2016、2017年開始,AI時代逐漸在產業服務市場落地生根。

這個階段,早期探索同樣艱難充滿挑戰,但也給阿里的AI算力之路帶來了第二層底色:實用化。

2016年的雲棲大會,阿里與杭州一同公佈了城市大腦計劃。此後,隨著城市大腦計劃的陸續落地,阿里在2017年宣佈成立了達摩院。此後的產業分工,是達摩院承擔AI演算法的開發與升級,而技術則通過阿里雲的AI解決方案與阿里生態進行應用轉化。

最強AI算力哪裡來?三個時代的阿里疊影

這一過程中,我們可以看到阿里的技術體系牽引起了AI演算法、資料應用,與產業場景三個維度的走廊,構築了一把探索AI真實價值的產業三叉戟。

達摩院的AI技術與服務體系,先後在工業、遙感、醫療、城市大腦等多個應用場景中落地。而阿里小蜜、拍立淘、支付寶、天貓精靈則成為了阿里內部生態的AI出口。根據阿里巴巴在杭州雲棲大會上公佈的人工智慧呼叫規模:每天呼叫超1萬億次,服務全球10億人,日處理影象10億張、視訊120萬小時、語音55萬小時及自然語言5千億句,阿里已經成為中國最大的人工智慧公司。

最強AI算力哪裡來?三個時代的阿里疊影

在AI應用時代早期,阿里通過一系列技術和組織部署,形成了技術先鋒營、資料轉化引擎,與場景實驗室的三個新角色,為AI算力走向實用化探索了落地入口。

AI晶片時代,平頭哥的萬里長征

如果對比CPU在70年代的歷史,可以發現AI從探索期走向實用化和成熟期,關鍵標誌就是核心晶片的大規模商用。

這個時代才剛剛開始,我們或許還無法代替計算史為它命名,但毫無疑問AI的晶片級基礎設施,是這個週期的關鍵開端。

曾幾何時,IBM從印表機走向了晶片讓美國人莫名其妙;而去年,阿里宣佈成立面向AI時代的平頭哥,確實也讓中國人大吃了一驚。

氣質獨特,生死看淡的平頭哥,在計劃中將為產業提供最全晶片產品形態,涵蓋處理器IP、SoC平臺以及晶片。

最強AI算力哪裡來?三個時代的阿里疊影

不久之前,我們見到了平頭哥釋出了面向端側的無劍平臺和玄鐵處理器IP。而當含光800面世時,則意味著平頭哥第一次挺進雲端,與阿里雲的計算、資料、演算法體系連為一體,構成了雲端最強推理算力的萌芽。

最強AI算力哪裡來?三個時代的阿里疊影

含光800效能突破,得益於達摩院的軟硬體協同創新:硬體層面採用自研晶片架構,通過推理加速等技術解決晶片效能瓶頸問題;軟體層面整合了先進AI演算法,針對CNN及視覺類演算法深度優化計算、儲存密度,可實現大網路模型在一顆NPU上完成計算。

根據雲棲大會的現場演示,在城市大腦中實時處理杭州主城區交通視訊,需要40顆傳統GPU,延時為300ms,使用含光800僅需4顆,延時降至150ms。拍立淘商品庫每天新增10億商品圖片,使用傳統GPU算力識別需要1小時,使用含光800後可縮減至5分鐘。

雖然平頭哥的萬里長征剛剛開始,但是這第一步,確實已經跨了出來。

最強AI算力哪裡來?三個時代的阿里疊影

關於未來時代的疊影,平頭哥用含光800做了一聲怒吼,它的意思大概是,阿里將突入最底層,在計算基礎設施中完成對AI最強算力的探索。

雲,AI,到晶片,三個時代的疊影,讓最強AI算力自然流淌而出,雲氣萬物裡。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2658420/,如需轉載,請註明出處,否則將追究法律責任。

相關文章