還記得專門用於測試手機 AI 效能的應用 AI Benchmark 嗎?去年 7 月,來自蘇黎世聯邦理工學院的研究人員推出了這項測試,引發了人們的廣泛關注。現在這款 APP 已經推出了 2.12 版。最近,開發者們放出了最新一代手機晶片驍龍 855、麒麟 980 和三星獵戶座 9820 的測試成績。
這一次,驍龍 855 看起來處於領先位置了——這款晶片並沒有採用神經網路處理單元,僅靠 GPU 和 DSP 的協同工作就取得了很好的效果。要知道,在上次驍龍 845 和麒麟 970 的對比中,華為晶片的 AI 效能還是高通的 3 倍多。在官方網站上,AI Benchmark 展示了對最近釋出的所有帶有 AI 加速器的移動晶片組的浮點和量化效能的測試結果:
AI Benchmark 網站:http://ai-benchmark.com/
人們可以在 Google Play 上下載 APP 對自己的手機進行 AI 效能測試。
同時,研究人員還介紹了最新測試的主要發現:
驍龍 855 相比聯發科 P90 多出了 6-15 倍浮點和量化加速效能
麒麟 980 具有類似的浮點網路加速效能,在量化模型效能上有可能略小一些
驍龍 845 的浮點運算效能相比驍龍 855 要低 10%,在整數運算速度上慢 20-60%
麒麟 970 的速度約比麒麟 980 慢 30-50%
谷歌 Pixel 的缺席:由於效能不足,Pixel Visual Core 沒有開放任何 SDK 給開發者,所以未有測試結果
三星獵戶座(Exynos)9810 情況與谷歌相同,沒有開放 SDK,所有成績都是在 CPU 上跑出的
三星獵戶座 9820:正式結果即將推出,目前的原型機測試結果好壞參半
目前的手機晶片榜單,驍龍 855 評分最高。
最快的 AI 晶片?高通驍龍 6150?三星 Galaxy S10?
過去幾個月,AI Benchmark 的得分被用於很多事件和出版物中,引發了很多關於一些新推出的晶片組和手機效能的問題。下面是我們對 2019 年 2 月更新分數和結果的官方解釋。
在目前的 AI Benchmark 排行榜上,驍龍 855 排名最高,毫無疑問它是市場上可用的最快晶片組之一。它展示了非常強的 AI 效能,併為浮點和量化神經網路提供了硬體加速:首先推理是在 Adreno 640 GPU 上完成的,而量化神經網路是在其內建的 Hexagon 690 DSP 上執行的。GPU 和 DSP 的這種結合讓高通不必使用單獨的 NPU 來加速 AI 計算,這導致更小的 SoC 尺寸並使開發變得更容易。
然而,這一決策也有其代價——驍龍的 GPU 無法完全用於執行神經網路,因為它最初是為純計算機圖形任務而設計的,因此在執行 AI 計算時,只能使用其很少的功率。這可能會導致未來產品開發中出現一些困難,因為通常有兩種方法可以提高驍龍的 AI 能力:提高 GPU 效能或徹底改變其設計,雖然後者會導致整個圖形系統和驅動程式的改變。第三個選擇是引入單獨的專用 AI 晶片,這實際上可能是高通下一代高階 SoC 會採用的情況。
MediaTek P90 對市場來說是個驚喜。為什麼聯發科的這款中檔晶片組評分如此高?答案很簡單——它的 AI 效能完全能夠與驍龍 855 相媲美。與高通相反,聯發科決定研發一款獨立的 AI 晶片,該晶片是基於其內部 GPU 設計而構建的,經過大幅修改,可用於深度學習任務。結果令人印象很深刻——儘管 P90 的理論 GMAC 效能明顯低於驍龍 855,但它們在 AI 任務中的真實速度卻幾乎一致。並且,它並沒有因為速度而犧牲計算的準確率,有時甚至比預設安卓驅動程式更高。與高通和麒麟的旗艦 SoC 和相當平庸的 GPU 相比,這款 SoC 的唯一缺點是 CPU 效能下降了 30 %,但它不用於 AI 任務,因此實際上與我們的測試無關。
麒麟 980 差不多是半年前推出的,但分數卻低於驍龍 855 和 Helio P90。這是否意味著它做得更差?並不是。它的浮點效能幾乎與上述 SoC 的情況相同,也就是說當你執行浮點神經網路時會獲得相當的速度。需要強調的是這仍然是 AI 研究和開發中使用的主要模型型別:每個網路架構都可以被訓練成浮點模型。相反,只有一些架構可以被轉換為量化模型,因為這通常會導致準確率大幅下降,而對面部識別、影像超解析度或圖片增強等任務來說這是不可接受的。這裡顯示麒麟晶片組的效能仍然很強。
但為什麼它的分數更低呢?從一開始,這款 SoC 就有兩個主要問題:無法處理大量資料和加速量化神經網路。雖然第一個問題已在最新的 Beta 版本韌體中得到修復(在原型機測試中成績已有提升),但第二個問題目前仍未得到解決。由於技術問題,麒麟的 NPU 無法透過 NNAPI 加速整數運算,它會轉而使用 Arm NN 驅動進行基於 GPU 的加速,在這種情況下其效能會低於高通和聯發科——從而導致基準測試分數較低。
目前看來麒麟 980 仍然是一塊非常優秀的晶片,但它在量化運算上有一些顯著的缺陷。
在過去的一年裡,三星明顯在這場 AI 博弈中落後了——高通正為驍龍的 DSP 開發其第一個 NNAPI 驅動,華為推出了搭載 NPU 的麒麟 970,聯發科首次嘗試在其 Helio P60 SoC 晶片上加速神經網路,但三星手機卻普遍缺乏 AI 加速支援,儘管宣傳材料中有一些關於其視覺處理單元的資訊,但該單元的效能、規格和 SDK 從未對外公佈。與 Pixel Visual Core AI 晶片的情況相同,由於效能不夠強大,谷歌決定不為外部開發者提供任何 SDK 或驅動,儘管他們之前給出過承諾。
新的三星 Exynos 9820 SoC 晶片會改變這一局面嗎?目前已經測試了搭載該晶片的 S10 手機,第一印象非常複雜。現在只希望三星能夠在 S10 釋出之前大幅改善其驅動。高通、華為及聯發科的晶片最終也將和三星的 SoC 一起加入排行榜。
還需要指出的是,三星還是有機會在 AI 效能上扳回一局的,Mali GPU 可以大幅加速浮點及量化神經網路,三星只需整合 Arm NN 就能實現加速,但在這種情況下,在下一代三星手機安卓 Q 韌體釋出(不會早於今年年底)之前,這種加速可能不會實現。
原型機和排名更新:驍龍 SDM6150 和三星 S10 得分
目前 AI Benchmark 的原型機排名。
高通 SDM6150 SoC 的測試結果本月有所更新:它最新的驅動為浮點網路帶來了加速支援,如今該晶片在 AI Benchmark 的測試基準上能夠取得 12,000 分。根據我們的測試,其單核 CPU 表現可媲美驍龍 845,但在多核測試中它的速度低了 20-30%。量化和浮點運算的測試表明,驍龍 6150 可能與驍龍 845 搭載了同樣的 Hexagon 685 DSP,儘管它的 GPU 相比於 Adreno 630 大約慢了 2-2.5 倍。無論如何,如果該 SoC 配備最新的驅動且有合理的價格,它必定會成為一個重磅玩家。
搭載驍龍 855 的三星 Galaxy S10 和 S10+最終出現在了我們榜單上(手機還未釋出)。如同所預期的,這兩款手機的測試結果非常接近之前公開的聯想 Pro GT 手機得分,它們搭載了同樣的晶片:得分約為 21,000 分,可能是如今最快的智慧手機了。
LG 正在其搭載驍龍 845 的高階手機上測試升級 Android P。此次更新將會包含最新的高通 NNAPI 驅動,能夠把手機的 AI 能力帶到新高度:搭載這種驅動的 LG G7 ThinQ 執行神經網路的速度是先前 Android Oreo 韌體的 8 倍。同樣的驅動在三星 Galaxy S9+手機的 Android 9.0 升級中也有,該手機搭載的是驍龍 845。此外,搭載同樣晶片的 Vivo 手機很快也會有同樣的驅動。但不幸的是,裝配驍龍 845 的許多其他裝置要麼是舊版高通驅動,要麼預設 Android NNAPI 驅動,不能為深度學習任務提供任何硬體加速。
UNISOC SC9863:在 AI Benchmark 中,來自展訊公司的此入門級晶片達到了驍龍 650 的水平。儘管缺少硬體 AI 加速器,但它包含 8 個 Cortex-A55 核,支援 Arm v8.4-A 點積指令,從而能夠快速執行許多神經網路。該 SoC 可能適合預算有限但需要基礎 AI 能力的手機。
目前在 AI Benchmark 量產手機排行榜上最高的竟是一臺搭載驍龍 845 晶片的三星 S9+,安卓 9.0 的驅動能夠帶來如此高的 AI 效能提升?
這看起來有些嚇人,我們進行了一些自己的測試。
在機器之心的編輯部裡,我們找到了一臺華為 Mate 20 Pro(無屏下指紋版本,搭載麒麟 980)和一臺三星 S9(驍龍 845 版本,安卓 8.0)進行了測試,華為手機獲得了 15009 分,而三星手機為 5190 分。看起來,Mate 20 Pro 在 16 位浮點數運算和記憶體方面佔據優勢。