蘋果A系列晶片的三年AI進化:為何要大規模升級AI算力?

naojiti發表於2020-09-21

9月16日,蘋果秋季新品釋出會如約而至,但傳聞中的iPhone12卻要等到下個月才能見到。釋出會僅上新了兩款智慧手錶和兩款iPad平板電腦,新品iPad Air 4則搭載了最新的處理器晶片A14 Bionic(仿生)處理器。這幾款新產品香不香另說,A14 Bionic處理器卻成為了此次釋出會的最大亮點。

根據蘋果的介紹,A14 Bionic處理器是蘋果首款採用5nm工藝打造移動裝置晶片,電晶體數量相較於A13 Bionic處理器的7nm晶片增加了近40%,電晶體數量達到了驚人的118億顆。

僅憑工藝製程的提升,A14在效能和功耗表現上自然會有一定的提升。官方宣稱,在效能比較上,CPU提升40%,全新GPU構架提升30%。不過,讓外界吐槽的是,這一資料是A14跟A12比較得出來的。這讓A13情何以堪呢?

而根據蘋果之前公佈的資料,A13相比A12在CPU和GPU效能上都提高了20%。因此,如果這兩代的處理器效能指標測量標準一致的話,則A14的CUP效能僅比A13快了約16%,GPU效能僅比A13提升了約8.3%。可以說,如果排除掉5nm工藝本身所帶來的改進,相對A13來說,A14在CPU和GPU核心本身效能上的提升其實並不高。

不過,在AI算力上,A14相比A13則有了非常大的提升,從之前的8核NPU直接翻倍提升到16核NPU。根據蘋果的測試,A14的AI運算能力也提升到了11.8萬億次,機器學習速度提升了70%,機器學習加速器則令運算速度快達10倍,將各種機器學習應用的效能表現提升至全新水平。

如果留意就會發現,蘋果從A11到A14,每一次在AI運算效能上都做了大幅地提升。儘管我們看到蘋果並不總是以AI晶片或者AI智慧終端為噱頭來做宣傳,但事實上蘋果iOS系統上已經遍佈各種AI應用或者功能,對AI算力增長提出了超高的需求;與此同時,安卓陣營高階晶片廠商在AI晶片上面的頻頻發力,正在縮短甚至追上與蘋果的A系列晶片的差距,這些可能都是構成蘋果移動終端晶片的AI算力爆發式增長的緣由。

從A11到A14,蘋果的AI算力進化

2017年,AI已經成為大眾熱議的話題。此時沒有一家終端晶片廠商不是以AI作為產品的新噱頭,但真正能在AI晶片方面拿得出手的廠商也沒有幾家。這一年華為的麒麟970橫空出世,搶到了首發。10天后,蘋果的A11 Bionic也正式釋出,A11採用10nm工藝製程、六核CPU、自研三核心GPU設計。

之所以可以稱為“AI晶片”,就在於A11首次搭載神經網路引擎處理器單元(Neural Network Processing Unit,NPU),並且在新的神經網路引擎上蘋果釋出了第一代Core ML,運用本地化人工智慧加速器進行機器學習。

A11搭載的NPU採用雙核設計,每秒運算次數6000億次,主要處理機器學習任務,能夠識別人物,地點和物體,主要針對的應用是iPhone新推出的人臉識別鎖屏FaceID以及人臉關鍵點追蹤Animoji,且NPU算力並不對第三方應用開放。

蘋果A11處理器的標誌意義,除了成為蘋果自主研發程度最高的一代處理器之外,其實也和華為一起真正地開啟了移動終端的AI時代。此後幾乎所有手機廠商都把AI運算能力當作宣傳賣點和升級點。

蘋果在2018年推出的A12 Bionic,採用了臺積電當時最新的7nm工藝製程,蘋果自研的Fusion架構,而神經網路引擎從雙核直接升級到八核,能夠實現每秒5萬億次計算,比較上一代有了8.3倍的提升。第二代神經網路引擎才是在算力和效能上能夠實現更多AI功能。另外,A12採用了全新的智慧HDR演算法以及core ML帶來的影像識別、第三方APP垃圾資訊處理等功能,AI應用開始普及。

2019年釋出的A13 Bionic處理器,CPU、GPU和NPU的核心數都與A12相同,只是採用了臺積電升級版7nm工藝,整合85億個電晶體,效能、功耗都有了一定提升,而神經網路引擎的峰值算力提升到每秒6萬億次計算,提升幅度並不顯著,同樣是為面容ID、三攝系統、AR類APP等機器學習應用提供算力支援。不過值得一提的是,透過在CPU中加入2個機器學習加速器,讓CPU可以達到每秒1萬億次的矩陣數學運算。同時,Core ML3可以與機器學習控制器配合,自動為CPU、GPU和NPU分配任務。

這次釋出的A14處理器晶片上,神經引擎核心數再次翻倍達到16個,每秒運算次數達到了驚人的11.8萬億次,機器學習速度提升了70%,機器學習加速器則令運算速度快達10倍,將各種機器學習應用的效能表現再次大幅提升。

AI應用的“猛虎”,蘋果AI晶片大規模升級的內因

根據資料,早在2014年,蘋果已經在新一代架構晶片Soc的開發中加入專門的AI晶片。而在此之前,蘋果的AI算力是由“CPU+GPU”實現,其自主開發AI晶片的設計思路則是由CPU和GPU處理的AI任務轉向由專門的AI晶片進行處理,最終將晶片整合到終端裝置上。

與此同時,隨著蘋果移動終端在拍照攝影、圖形處理等應用上面越來越需要用到神經網路和機器學習、深度學習的演算法運算,這些需求使得蘋果開始考慮將AI應用的運算必須採用神經引擎這一專門定製的處理器單元來完成這些計算。

2017年,蘋果的神經引擎處理器正式落地。

不過讓外界驚訝的是,為何短短三年之中,A系列晶片的AI算力得到了將近20倍的提升,遠遠超出Soc晶片其他處理器的效能提升幅度?

一方面是CPU和GPU的效能,在現有的工藝製程進化和既定架構的約束上提升已經非常困難。隨著半導體工藝從7nm向5nm、3nm工藝升級,難度會越來越大,而可預期的提升卻可能並不顯著。反而AI加速器還會有相當大的設計提升空間。

另一方面是,終端應用對於動用CPU和GPU的需求正在達到一個使用者的使用極限,因此也沒有快速增長的需求,但是這些應用的AI算力需求則在大幅增長。

如果對蘋果iOS系統中的用到機器學習相關的功能和應用進行分析的話,我們看到最新兩代的iPhone和iPad已然是一部各個部分和細節都在使用AI的終端了。

在蘋果終端的細節體驗,已經有大量機器學習演算法的加持,但相應的體驗難以被使用者察覺。

比如,機器學習用於幫助iPad的軟體區分使用者在使用Apple Pencil繪圖時到底是不小心將手掌壓在螢幕上還是有意提供輸入的按壓。或者是在監控使用者使用習慣,以最佳化裝置的電池壽命和充電頻次,既可以改善使用者在兩次充電之間的時間,又可以保證電池的使用壽命。

還有像iPhone的拍照,使用者每次按下快門,裝置會快速連續拍攝很多張照片,然後經過機器學習訓練的演算法會分析每個影像,並將其認為是每個影像的最佳部分合成為一個結果。也就是iPhone拍照的卓越效果很大程度是靠“計算”出來的。蘋果正是透過iPhone中對影像訊號處理器(ISP)和神經引擎的協同處理,才使得照片質量獲得大幅提升。

蘋果在終端本地大幅提升神經引擎的運算能力,以及配合圖形計算引擎和AI加速等功能,可以在移動終端中執行非常高難度的機器學習任務。比如在iPad Pro上,透過神經引擎的計算能力,結合Project Aero 軟體,iPad Pro 能將 PSD 中創作的每一個圖層以獨立的 AR 物件呈現在螢幕上,每個圖層都分離成一幕栩栩如生的景觀,這對創作者來說相當具有吸引力。

此外,蘋果已經加入的顯著的AI新功能,諸如機器學習在翻譯、內建聽寫、輸入預測、健康特性分析與預測上面,都需要大量的機器學習參與。

而蘋果選擇在機器學習任務的本地化計算的另一大原因,可能是為了將資料留在本地,用以保護使用者隱私。我們知道,機器學習的本質就是對海量資料進行學習,而資料的採集和分析一直是谷歌、facebook這些網際網路公司的“原罪”,作為承諾嚴格遵守使用者隱私資料保護的蘋果,自然要做出保證,儘量將機器學習演算法所需要的使用者資料留在使用者的移動終端當中,但與此同時要保證AI演算法的有效,就必須對終端晶片的AI算力引擎做出大幅提升。

當然,蘋果自身終端系統對於AI算力升級的要求,只是一隻內生的吞噬算力的“猛虎”,在外部競爭中,蘋果還要面對一群實力強勁的“追龍”,在AI算力提升上不斷地應戰。

安卓陣營的“追龍”,蘋果AI算力快速升級的外因

蘋果自研的A系列處理器晶片,一直以來以創新和高效能著稱,雖然最近兩年,安卓系的高階晶片,諸如高通的驍龍晶片、聯發科Helio晶片、華為海思的麒麟晶片則大有追趕之勢。

如果拋去綜合效能的討論,但是在AI晶片算力上面,高通的驍龍處理器在效能上和數量上都已經有超過蘋果A系列晶片的可能。

比如在2019年上半年手機AI晶片排行榜上,排名前十的智慧手機AI晶片,其中前四名分別是高通驍龍855、蘋果A12 Bionic、聯發科Helio P90和海思麒麟980。但值得關注的是,除了第二、三、四名,這份榜單中的其他位置都被高通驍龍晶片佔據。

與蘋果採取專用NPU晶片來提供AI算力不同的是,高通的驍龍處理器採用了異構計算的方式,推出了自研的AI引擎,透過CPU、GPU和DSP(Hexagon處理器)組合相互配合,執行神經網路計算的效率,根據不同的應用場景來安排工作負載。

而預計在今年年底釋出的高通驍龍875,同樣採用了5nm製程工藝,與7nm相比邏輯密度提高80%,其基礎效能較上代提升15%,功耗降低30%。非常激進的是,高通這次採用了ARM的Cortex X1超大核心設計,為“1+3+4”八核心三簇設計模式,其中1為Cortex X1超大核心,3為大核,採用Cortex A78,4為能效核心。據業界的預測,驍龍875無論在綜合效能還是在AI算力上都有超越A14的可能。

此外,高通透過AI引擎的的高、中端晶片佈局,與不同的軟硬體企業一起,從底層框架、硬體核心、軟體等層面,將AI能力應用到了海量的移動終端和智慧裝置上,形成基於AI應用的合作生態。

高通在AI算力上的激進演化以及在AI能力上的不斷賦能,已經開始形成對於蘋果的A系列晶片領導力的巨大威脅。在面臨安卓陣營這些“追龍”對手如此“給力”的努力下,蘋果自然也會有強大的外部動力來大幅升級自身的效能優勢。就像驍龍875這樣的效能怪獸的出現,始終會追在蘋果身後,準備吊打蘋果。

反過來看蘋果,其NPU的效能升級戰略也並未顯露頹勢。根據專業人士的說法,目前,蘋果A系列晶片上NPU佔晶片總面積約為5%,未來NPU的面積能夠達到類似GPU佔有的20%的面積的程度,AI算力至少還有4倍的提升空間,此外還有提升演算法和晶片之間的協同設計,同時透過Core ML的進化來加強不同AI模型的異構設計,同樣可以發揮其他SoC晶片部分的潛在算力。總體來說,蘋果在AI算力的提升上面還有巨大的增長空間。

我們看到,蘋果和安卓陣營在高階晶片廠商在晶片效能的升級,正在從CPU所引領的摩爾定律的賽場轉向以AI算力增長為代表的新賽道上。而從AI算力的增長潛力來看,這一升級戰在未來幾年會更趨激烈。

然而最可惜的是,這場終端晶片AI角逐賽裡,未來會缺席一位來自中國的實力選手。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2723016/,如需轉載,請註明出處,否則將追究法律責任。

相關文章