手機晶片誰是AI之王？高通、聯發科均超華為

640?wx_fmt=jpeg

整理 | apddd

出品 | AI科技大本營（ID:rgznai100）

儘管相當數量的人工智慧服務，是由雲端計算網路提供，但在響應低延遲、保護隱私、應用場景等方面，手機AI晶片無可替代。例如人臉解鎖，影像增強、識別，智慧助手，拍照場景識別，這些你我每天都會接觸的功能，離不開手機神經引擎的加持。

640?wx_fmt=png

AI-Benchmark測評

AI-Benchmark是蘇黎世聯邦理工學院（ETH Zürich）計算機視覺實驗室Andrey Ignatov開發的AI基準測試程式，它不依賴於每個SoC供應商自己的SDK工具和API基準，能更客觀地展示終端效能。

其測試任務包括以下9項（http://ai-benchmark.com/tests.html）：

目標識別/分類：這是一個非常基礎但很強大的神經網路，能夠基於一張照片識別1000個不同的物件類別，準確率約為70%。經過量化，其大小可小於 5MB，再加上低耗記憶體，可在幾乎所有現有智慧手機上使用。
精確目標識別/分類：這是對上一個網路的進一步擴充套件，更加精確，但代價是規模是原來的4倍，且對計算的要求較高。一個明顯的優勢是——它可以處理解析度更高的影像，這意味著更精確的識別和更小目標的檢測。
人臉識別：實現方式為，對於每個人臉影像，神經網路會對人臉編碼並生成128維的特徵向量，該特徵向量不隨縮放、移動或旋轉而改變。然後在資料庫中檢索和此向量最匹配的特徵向量（以及對應的身份），資料庫裡包含數億個此類資訊。
影像去模糊：模糊是通過一種最原始、最簡單、最輕量級的神經網路 SRCNN（只有 3 個卷積層）去除的。即便如此，它仍然顯示出相當令人滿意的結果。
影像超解析度：使用一個19層的VGG-19網路。儘管目前來看，該網路的表現並不驚豔，也不能重建高頻部分。但它對於繪畫仍是理想的解決方案，因為該網路可以讓影像變得更加清晰、平滑。
另一種影像超解析度：任務同上，但完成方法略有不同，如果使用其他神經網路訓練我們的神經網路會如何？我們安排兩個網路去完成兩個不同的任務：網路嘗試解決上面提到的超解析度問題，網路B觀察其結果，嘗試找到其中的缺陷並懲罰網路A。
語義影像分割：根據車載攝像頭拍攝的照片檢測19類目標（如車、行人、路、天空等）。
影像增強：經過恰當訓練的神經網路可以讓舊手機上的照片看起來更時髦。
記憶體極限：任務4使用的SRCNN是最輕便、簡單的神經網路之一，這項測試的目的是找到裝置的極限，即這個最簡易的網路到底能處理多大的影像。

640?wx_fmt=png

一騎絕塵 or 不分勝負

在剛出爐的2019年2月排行中，高通驍龍855位列榜首,緊隨其後是聯發科Helio P90處理器。而華為最強手機處理器麒麟980（去年9月釋出），在這項測試中，已被驍龍855大幅甩開35%。

驍龍855（總分19769）對浮點和量化神經網路都能提供出色的硬體加速——前者依靠Adreno 640 GPU，而量化網路則執行在Hexagon 690 DSP中。這種組合省略了AI獨立運算單元，依舊是傳統的CPU/GPU及DSP/ISP兼職處理AI任務。這種設計思路，令SoC更小巧，也更容易開發，但原本用於圖形任務設計的GPU，在更遠的未來可能會觸及架構瓶頸，難免還要面對晶片架構的一次大調整。

晶片之爭既是長跑，也是衝刺。

640?wx_fmt=jpeg

關於量化網路
開發神經網路時最大的挑戰是讓其真正起效，訓練一般希望速度快準確率高。使用浮點演算法是保持結果精確最簡單的方式——GPU擁有加速浮點演算法庫，所以不需要過多關注其他數值格式。
而隨著大量神經網路模型投入實際應用。訓練計算需求隨研究者數目線性增長，預測所需的週期與使用者數目成正比。這意味著純預測效率迫在眉睫。
這就是量化神經網路的用武之地：量化網路最初的動機是減小模型檔案尺寸，在模型載入後仍然轉換回浮點數，這樣你已有的浮點計算程式碼無需改動即可正常執行，另一個量化的動機是降低預測過程的計算資源需求。

640?wx_fmt=jpeg

雖然只是中端晶片，但聯發科P90（總分18231）的實際AI效能，幾乎與驍龍旗艦處理器不分伯仲（雖然P90理論GMAC引數佔下風），它採用了獨立的AI晶片——其設計來自GPU“魔改”，以優化深度學習任務。與競爭對手相比，這款晶片的不足在於CPU效能弱了30%，GPU也差強人意。

華為麒麟980（總分14646）釋出已近半年，雖然賬面成績遜一籌，但值得指出的是，它的浮點效能與兩個對手不分勝負，這意味著執行浮點神經網路任務，亦相差無幾——這是當下AI研究和開發的主流技術，而且每個網路架構，都能以浮點模型訓練。反之則不然，能轉換為量化模型的網路較少，且常常伴隨著準確度大幅下降。所以在2019年初，華為麒麟980仍算強大。

回顧歷史，早在2004年，華為開始組建手機晶片研發隊伍，經過5年研發，到2009年，才拿出第一款海思K3。到2014年初，推出麒麟910，首次採用28nm製程，才有自己的名聲。整個2014年，華為不停的迭代，一共釋出了6款晶片，終於有了長足進步。

再到2015年11月，麒麟950 SoC釋出，採用16nm FinFET Plus工藝，勉強追上高通。而在950之後，華為又在2016年釋出了960，2017年釋出970，再到2018年7月釋出710、8月釋出980，終於開始領跑——之後的一個季度，華為麒麟970/980家族幾乎壟斷了AI-Benchmark商用裝置榜單。

那麼，目前地表最強的移動AI處理器最終花落驍龍855？隔壁蘋果家的A12X Bionic可能並不同意（AI-Benchmark目前只支援Android平臺）。

640?wx_fmt=jpeg