手機晶片誰是AI之王?高通、聯發科均超華為

AI科技大本營發表於2019-02-12

640?wx_fmt=jpeg

整理 | apddd

出品 | AI科技大本營(ID:rgznai100)


儘管相當數量的人工智慧服務,是由雲端計算網路提供,但在響應低延遲、保護隱私、應用場景等方面,手機AI晶片無可替代。例如人臉解鎖,影像增強、識別,智慧助手,拍照場景識別,這些你我每天都會接觸的功能,離不開手機神經引擎的加持。

640?wx_fmt=png


AI-Benchmark測評


AI-Benchmark是蘇黎世聯邦理工學院(ETH Zürich)計算機視覺實驗室Andrey Ignatov開發的AI基準測試程式,它不依賴於每個SoC供應商自己的SDK工具和API基準,能更客觀地展示終端效能。

其測試任務包括以下9項(http://ai-benchmark.com/tests.html):


  1. 目標識別/分類:這是一個非常基礎但很強大的神經網路,能夠基於一張照片識別1000個不同的物件類別,準確率約為70%。經過量化,其大小可小於 5MB,再加上低耗記憶體,可在幾乎所有現有智慧手機上使用。

  2. 精確目標識別/分類:這是對上一個網路的進一步擴充套件,更加精確,但代價是規模是原來的4倍,且對計算的要求較高。一個明顯的優勢是——它可以處理解析度更高的影像,這意味著更精確的識別和更小目標的檢測。

  3. 人臉識別:實現方式為,對於每個人臉影像,神經網路會對人臉編碼並生成128維的特徵向量,該特徵向量不隨縮放、移動或旋轉而改變。然後在資料庫中檢索和此向量最匹配的特徵向量(以及對應的身份),資料庫裡包含數億個此類資訊。

  4. 影像去模糊:模糊是通過一種最原始、最簡單、最輕量級的神經網路 SRCNN(只有 3 個卷積層)去除的。即便如此,它仍然顯示出相當令人滿意的結果。

  5. 影像超解析度:使用一個19層的VGG-19網路。儘管目前來看,該網路的表現並不驚豔,也不能重建高頻部分。但它對於繪畫仍是理想的解決方案,因為該網路可以讓影像變得更加清晰、平滑。

  6. 另一種影像超解析度:任務同上,但完成方法略有不同,如果使用其他神經網路訓練我們的神經網路會如何?我們安排兩個網路去完成兩個不同的任務:網路嘗試解決上面提到的超解析度問題,網路B觀察其結果,嘗試找到其中的缺陷並懲罰網路A。

  7. 語義影像分割:根據車載攝像頭拍攝的照片檢測19類目標(如車、行人、路、天空等)。

  8. 影像增強:經過恰當訓練的神經網路可以讓舊手機上的照片看起來更時髦。

  9. 記憶體極限:任務4使用的SRCNN是最輕便、簡單的神經網路之一,這項測試的目的是找到裝置的極限,即這個最簡易的網路到底能處理多大的影像。

640?wx_fmt=png


一騎絕塵 or 不分勝負


在剛出爐的2019年2月排行中,高通驍龍855位列榜首,緊隨其後是聯發科Helio P90處理器。而華為最強手機處理器麒麟980(去年9月釋出),在這項測試中,已被驍龍855大幅甩開35%。

驍龍855(總分19769)對浮點和量化神經網路都能提供出色的硬體加速——前者依靠Adreno 640 GPU,而量化網路則執行在Hexagon 690 DSP中。這種組合省略了AI獨立運算單元,依舊是傳統的CPU/GPU及DSP/ISP兼職處理AI任務。這種設計思路,令SoC更小巧,也更容易開發,但原本用於圖形任務設計的GPU,在更遠的未來可能會觸及架構瓶頸,難免還要面對晶片架構的一次大調整。

晶片之爭既是長跑,也是衝刺。

640?wx_fmt=jpeg


關於量化網路

開發神經網路時最大的挑戰是讓其真正起效,訓練一般希望速度快準確率高。使用浮點演算法是保持結果精確最簡單的方式——GPU擁有加速浮點演算法庫,所以不需要過多關注其他數值格式。

而隨著大量神經網路模型投入實際應用。訓練計算需求隨研究者數目線性增長,預測所需的週期與使用者數目成正比。這意味著純預測效率迫在眉睫。

這就是量化神經網路的用武之地:量化網路最初的動機是減小模型檔案尺寸,在模型載入後仍然轉換回浮點數,這樣你已有的浮點計算程式碼無需改動即可正常執行,另一個量化的動機是降低預測過程的計算資源需求。

640?wx_fmt=jpeg

雖然只是中端晶片,但聯發科P90(總分18231)的實際AI效能,幾乎與驍龍旗艦處理器不分伯仲(雖然P90理論GMAC引數佔下風),它採用了獨立的AI晶片——其設計來自GPU“魔改”,以優化深度學習任務。與競爭對手相比,這款晶片的不足在於CPU效能弱了30%,GPU也差強人意。

華為麒麟980(總分14646)釋出已近半年,雖然賬面成績遜一籌,但值得指出的是,它的浮點效能與兩個對手不分勝負,這意味著執行浮點神經網路任務,亦相差無幾——這是當下AI研究和開發的主流技術,而且每個網路架構,都能以浮點模型訓練。反之則不然,能轉換為量化模型的網路較少,且常常伴隨著準確度大幅下降。所以在2019年初,華為麒麟980仍算強大。

回顧歷史,早在2004年,華為開始組建手機晶片研發隊伍,經過5年研發,到2009年,才拿出第一款海思K3。到2014年初,推出麒麟910,首次採用28nm製程,才有自己的名聲。整個2014年,華為不停的迭代,一共釋出了6款晶片,終於有了長足進步。

再到2015年11月,麒麟950 SoC釋出,採用16nm FinFET Plus工藝,勉強追上高通。而在950之後,華為又在2016年釋出了960,2017年釋出970,再到2018年7月釋出710、8月釋出980,終於開始領跑——之後的一個季度,華為麒麟970/980家族幾乎壟斷了AI-Benchmark商用裝置榜單。

那麼,目前地表最強的移動AI處理器最終花落驍龍855?隔壁蘋果家的A12X Bionic可能並不同意(AI-Benchmark目前只支援Android平臺)。

640?wx_fmt=jpeg


(本文為AI科技大本營原創文章,轉載請微信聯絡 1092722531)

徵稿

640?wx_fmt=png


推薦閱讀:

                         640?wx_fmt=png

點選“閱讀原文”,開啟CSDN APP 閱讀更貼心!

相關文章