從雲到端,谷歌的AI晶片2.0

naojiti發表於2020-04-22

得晶片者得天下。我們可以把這句話再延伸一下說,得AI晶片者得未來的天下。

對於智慧終端廠商來說,能夠自研SoC晶片似乎才是頂級實力的象徵。眾所周知,盤踞全球智慧手機前三甲的三星、華為、蘋果,無一例外都擁有自研的SoC晶片。

(2020智慧手機晶片跑分資料TOP10)

現在,經歷了多年的輔助AI晶片的經驗積累之後,谷歌終於要入場智慧終端的核心硬體——SoC處理器晶片了。

據外媒Axois報告,谷歌在自研處理器方面取得了顯著進步,最近其自主研發的 SoC 晶片已經成功流片。

據悉,該晶片是谷歌與三星聯合開發,採用5nm工藝製造,“2+2+4”三架構設計的8核CPU叢集,以及搭載全新ARM公版架構的GPU,同時在ISP和NPU上整合了谷歌Visual Core AI視覺處理器。這讓谷歌的終端晶片能夠更好地支援AI技術,比如大幅提升谷歌助手的互動體驗。

在上市計劃上,谷歌的這一SoC處理器晶片預計將於率先部署在下一代Pixel手機以及谷歌筆記本Chromebook中。

谷歌的這一舉動被視為對蘋果自研處理器模式的靠攏,從“原生系統+最主流旗艦晶片”變為“原生系統+自研晶片”,谷歌的用意肯定不僅是想擺脫高通晶片的鉗制,更重要的是想透過自研晶片實現更好的軟硬體結合,使得安卓系統在自家硬體上發揮更大的效能優勢。

我們其實知道,自研晶片並不能在硬體利潤上帶給谷歌更多的價值,其中最有價值的地方在於將谷歌AI上面的優勢透過軟硬體的結合,在智慧終端上得到更好的應用。

我們也都知道,谷歌在AI晶片上入局最早,實力強勁。然而AI晶片的技術有多強,AI技術和晶片研發有哪些相互促進的關係?相信很多人還是不明就裡的,而這正是我們接下來要去深入探究的。

從雲端到終邊端,谷歌AI晶片的進階之路

在谷歌的TPU(Tensor Processing Unit,張量處理單元)處理器推出之前,大部分的機器學習以及影像處理演算法一直都是跑在GPU與FPGA這兩種通用晶片上面的。而提出了深度學習開源框架TensorFlow的谷歌則專門做出這樣一款為TensorFlow演算法設計的專用晶片。

TPU就這樣誕生了,然而讓TPU的聲名遠播卻是在AlphaGo大戰李世石的人機圍棋賽。據說,當時谷歌為TPU其實下了另一盤大棋的。因為在挑戰李世石之前,AlphaGo是跑在1202個CPU和176個GPU上面與棋手樊麾比賽的。這讓看過對弈過程的李世石很有信心。然而在比賽前幾個月,AlphaGo的硬體平臺換上了TPU,這讓AlphaGo的實力很快得到成長,後面的對戰局勢讓李世石就吃盡了苦頭。

(谷歌TPU晶片)

TPU是一種專用積體電路(ASIC),作為專門在谷歌雲使用的AI晶片,其使命就在於加速谷歌人工智慧落地的速度。在2017年穀歌公佈的第二代TPU上,其浮點運算能力高達每秒180萬億次,既可以用於推理,也可以用做訓練。而到了2018年的TPU3.0版本,其計算效能相比TPU 2.0提升八倍,可達每秒 1000 萬億次浮點計算。

此後,谷歌的AI佈局逐漸走向邊緣側。在2017年的谷歌雲服務年會上,正式釋出其邊緣技術,並推出了Google Edge TPU。

Edge TPU是谷歌專為在邊緣執行TensorFlow Lite ML模型而設計的ASIC晶片。Edge TPU 可用於越來越多的工業使用場景,如預測性維護、異常檢測、機器視覺、機器人學、語音識別,也可以應用於本地部署、醫療保健、零售、智慧空間、交通運輸等各個領域。

Edge TPU體型小、能耗低,因此只負責AI加速判別、加速推算,僅為加速器、輔助處理器的角色,可以在邊緣部署高精度AI,是對CPU、GPU、FPGA 以及其他在邊緣執行AI的ASIC解決方案的補充。

谷歌還在去年推出了基於Edge TPU晶片的等一系列開發硬體,以及本地化AI平臺Coral,為邊緣側提供優質、易部署的AI解決方案。

儘管TPU和Edge TPU主要是對深度學習起到運算推理加速的輔助伺服器,但我們仍然能夠看到谷歌在AI晶片上的佈局野心。從雲端,到邊緣端和手機智慧終端,正是理解谷歌AI晶片的內在邏輯。

(Pixel Visual Core)

從2017年開始,谷歌就在智慧手機上陸續推出了定製的攝像頭晶片“Pixel Visual Core”和“Pixel Neuro Core”,並用在了 Pixel 2、Pixel 3 和 Pixel 4上。

Pixel Visual Core,是一種影像處理單元(IPU),也是谷歌自研的第一款移動晶片,專門用於加速相機的HDR+計算,其使用了機器學習和計算攝影,可以智慧地修補照片不完美的部分,也使影像處理更加流暢和快速。這也是很多人說的谷歌手機的照片不是拍出來的,而是算出來的原因。

而到了去年,谷歌在Pixel 4上使用了Pixel Neural Core專用處理器來代替Pixel VIsual Core。神經網路演算法可以使谷歌手機的相機鏡頭識別所拍攝的物體,然後既可以將資料交給影像處理演算法去最佳化,也可以將資料輸出給谷歌助手進行識別。同時,Pixel Neural Core也可以讓谷歌助手進行更復雜的人機對話,還有進行離線的語音文字翻譯。

如果谷歌不是有著TensorFlow、Halide以及編譯器等AI演算法和開發軟體,谷歌的AI晶片的很多設計顯然是無法發揮太大作用的。軟硬體結合,才讓谷歌的晶片設計走得更為徹底和硬氣。

軟硬兼融,谷歌AI晶片快速迭代的硬氣底色

在網際網路公司的造芯賽道上,谷歌無疑是跑在最前面的一家。

據報導,早在2006年,谷歌就考慮在其資料中心部署 GPU或者 FPGA,或專用積體電路。而由於當時沒有多少要在專門硬體上執行的應用,因此使用谷歌大型資料中心的富餘計算能力就能滿足算力要求。

而一直到2013年,谷歌已經開始推出基於DNN的語音識別的語音搜尋技術,使用者的需求使得谷歌資料中心的計算需求增加了一倍,這讓基於CPU的計算變得特別昂貴。因此,谷歌計劃使用現成的GPU用於模型訓練,而快速開發一款專用的積體電路晶片用於推理。

後來我們知道這一專用定製晶片就是TPU,而這一快速開發的週期僅僅是15個月。基於軟體造芯,谷歌並非獨一家,但相比亞馬遜、Facebook來說,谷歌則一直有持續的晶片產品推出。谷歌能夠如此快速且高頻地進行“硬體”輸出,那自然是有其“硬氣”的原因的。

首先一定是戰略上的重視。此前谷歌CEO皮猜就曾強調,谷歌從來不是為硬體而硬體,背後的邏輯一定是AI、軟體和硬體一體,真正解決問題要靠這三位一體。

其次就是人才的重視。以當前谷歌這一消費端的SoC晶片為例。此前這一專案對外界來說早已是公開的“秘密”。從2017年底,谷歌就開始從蘋果、高通、英偉達等公司高薪挖“角”,其中包括蘋果A系列處理器著名的研發工程師John Bruno。但直到去年2月,谷歌才正式宣佈在印度班加羅爾的組建了一支“gChips”晶片設計團隊,致力於谷歌智慧手機和資料中心晶片業務,未來還會在該地辦新的半導體工廠。消費級晶片似乎只差臨門一腳了。

當然,最重要的因素還在於谷歌在AI晶片上的創新優勢。我們知道,AI晶片的研發,本身是一個週期長且耗費巨大資金的專案。晶片設計到成品的週期可能趕不上AI演算法的發展程式。如何實現AI晶片的硬體設計與演算法、軟體的平衡,成為谷歌設計晶片的關鍵優勢。

而谷歌提出的解決方案則更值得稱道,那就是用AI演算法設計AI晶片。

具體來說,AI晶片設計存在著以下難題。首先是,3D晶片的放置,在受限區域中跨層級配置數百到上千的元件,工程師們需要手動設計來進行配置,並透過自動化軟體進行模擬和效能驗證,這通常需要花費大量時間。其次是,晶片的設計架構趕不上機器學習演算法或神經網路架構的發展速度,導致這些演算法架構在現有的AI加速器上效果不佳。另外,儘管晶片的佈局規劃的設計程式在加快,但在包括晶片功耗、計算效能和麵積等多個目標的最佳化能力上仍然存在限制。

為應對這些挑戰,谷歌的高階研究科學家Mirhoseini和團隊研究人員Anna Goldie提出了一種神經網路,即將晶片佈局建模轉化為強化學習問題。

與典型的深度學習不同,強化學習系統不會使用大量標記的資料進行訓練。相反,神經網路會邊做邊學,並在成功時根據有效訊號調整網路中的引數。在這種情況下,有效訊號成為降低功率、改善效能和減少面積組合的替代指標。結果就是,系統執行的設計越多,其效果就會越好。

在對晶片設計進行了足夠長時間的學習之後,它可以在不到24小時的時間內為谷歌Tensor處理單元完成設計,而且在功耗、效能、面積都超過了人類專家數週的設計成果。研究人員說,這一系統還向人類同行教授了一些新技巧。

最終,谷歌團隊希望像這一AI系統能達到“在同一時間段內設計更多的晶片,以及執行速度更快,功耗更低,製造成本更低,外形體積更小的晶片”這一目標。

意在未來,谷歌SoC晶片整合的AI野心

這一次谷歌自研的終端處理器SoC晶片,其本質上還是谷歌AI晶片的延伸。

細心的人們應該已經發現,這次的SoC晶片並不是完全出自谷歌研發團隊,而是選擇了與三星展開了合作。從媒體的曝光看,谷歌這次的手機主控會採用5nm製程、Cortex-A78大核、核心數多達20個的新GPU,而這些恰好就是三星Exynos 1000的特徵。所以,這款三星堆料的晶片,最主要的“谷歌元素”就是在ISP和NPU上應用了谷歌自家設計的AI晶片。

(谷歌Pixel5諜照)

這一選擇自然有著谷歌充分的考慮和一些明顯的優勢,但也存在著一些不利的影響。

最直觀的好處就是加快了谷歌的手機端SoC晶片的研製速度,降低對高通處理器的依賴,並可以迅速應用到下一代谷歌pixel手機上。

另外一個好處是,谷歌主導的晶片設計將使得谷歌像蘋果一樣建成自己的封閉系統。谷歌最硬核之處就在於擁有龐大的資料和AI演算法。伴隨著應用層面不斷豐富的資料體驗和AI體驗,比如在飛航模式下實現語音實時轉錄文字的功能,手機的硬體效能以及系統的相容支撐就可能成為智慧手機的效能天花板。如何在安卓系統中將處理器效能發揮到最大,可能沒有誰比谷歌更清楚了。

畢竟前面幾款谷歌Pixel手機的市場表現都不溫不火,儘管其在拍攝演算法和AI助手等應用上面極具優勢,但在終端的外觀設計、螢幕、攝像頭、電池等硬體配置上一直存在“短板”,難以和全球幾家主流終端玩家的旗艦機型媲美。想必應用了最新一代的SoC晶片的新款Pixel機型的定價也將非常“高階”,但在硬體上的“偏科”,可能仍然會影響其整體的市場表現。

此外,由於這是一款全新的“非主流”晶片,也會對遊戲、軟體開發者而言,不再成為“軟體開發樣板機”的首選測試機型。

無論如何,這一整合了深度學習效能的SoC晶片,將為谷歌爭奪未來的AI市場做好準備,幫助谷歌、在移動終端上將語音識別、影像處理等AI應用的效能發揮到極致,提早一步佔領真正的智慧終端的領導者位置。

無論怎樣,谷歌的造“芯”舉動,一定會對上游晶片廠商以及智慧終端廠商帶來正面衝擊。如果透過“Whitechapel”證明了谷歌的“造芯”戰略的成功,那麼谷歌距離蘋果的差距還有多少呢?

自研晶片、安卓系統疊加最新AI計算能力,如果再補足硬體配置的短板,那麼谷歌極有可能打造一個安卓生態圈的軟硬體完美適配的閉環系統。

最後,我們發現一個比較令人疑惑的細節。此次晶片的代號為“Whitechapel”,名為“白教堂”。如果熟悉英美劇的讀者們,可能會看過一部名為《白教堂血案》的英劇。如果不是非要過度解讀的話,我們可以理解為某位重要研發者喜歡這部驚悚懸疑劇,所以以此來命名。如果非要“過度”解讀一下的話,谷歌可能是想用一個百年未解的“謎團”來預示著智慧終端的AI應用的紛爭的開場。

當然,這個答案也許還得等谷歌的新的Pixel手機上市才能揭曉。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2687599/,如需轉載,請註明出處,否則將追究法律責任。

相關文章