Arm推出全新MaliGPU助力下一代新科技

朗銳智科1發表於2018-03-30

Arm日前隆重宣佈推出兩款全新Mali GPU:Mali-G52和Mali-G31,為主流以及超高效能裝置提供嵌入式解決方案。憑藉全新的執行引擎設計,Mali-G52可在更小的晶片區域內實現更高效能,支援主流裝置實現機器學習(ML)和擴增實境(AR)等高階功能;而Mali-G31則是Arm迄今為止推出的最小的GPU,可支援用於數字電視(DTV)圖形開發和複雜使用者介面的最新一代API。

或許你認為僅僅只有那些最高階的移動裝置才會搭載機器學習功能,但令人驚喜的是一切正在以超出你預想的速度發展。朗銳智科(www.lrist.com)發現,即便在主流手機上,我們也希望裝置的攝像頭能夠自動識別臉部,以便準確對焦,或者能夠在相簿中準確搜尋到愛寵的照片。你或許尚未意識到,這些功能都是由機器學習實現的。

Arm認識到機器學習的重要性,並於近期有針對性地釋出了Project Trillium機器學習平臺。然而,儘管Arm效能強大的新一代機器學習處理器對於高階機器學習工作負載來說表現非常出色,但這只是更廣泛應用場景中的一種情況。正如我們近期所討論的那樣,在主流和入門級裝置中,為這樣一款處理器專門搭載足夠強大的晶片往往不切實際,但對於像我之前提到的那些負載量較小的功能,我們的GPU或CPU通常是適宜之選。

最新發布的Mali-G52將各項表現又一次全面推高一個等級。在上一代基於Bifrost架構GPU的成功之上,Mali-G52採用了全新設計的執行引擎——處理器中執行演算法的部分,從而實現了在較低的晶片預算內滿足機器學習所需的更高效能。與上一代處理器相比,Mali-G52每個執行引擎執行緒的數量增加了一倍,使所有複雜內容的計算效能提高一倍,但尺寸僅增加了22%,因此不會令合作伙伴發愁高昂的晶片預算。

不僅如此,Mali-G52還引入了Int8 dot的支援。終端上的機器學習推演演算法廣泛使用通用矩陣乘法器,但通常不需要達到FP16 / FP32的精度級別。在許多情況下,Int8效果相當,且效率更高。Mali-G52每個執行引擎的處理能力達到四個週期每執行緒,在當前影像檢測和其他機器學習基準測試中達到了上一代處理器機器學習效能近4倍的出色表現。

隨著使用者需求的增長,機器學習已成為我們所有裝置中最優先考量的要素。這款GPU能夠以如此卓越的質量執行具有挑戰性的機器學習任務負載,這一效能將徹底顛覆主流終端市場。


相關文章