AI晶片的新風向

半導體行業觀察發表於2020-07-14

人工智慧已經成為目前晶片行業的一個重要驅動力。回顧人工智慧在半導體行業的發展,我們可以清晰地看到一條從雲到終端的演進路線。

最初,人工智慧主要是作為一種服務部署在雲端。本代人工智慧基於大資料和神經網路,因此在訓練時候需要大量的算力,在雲端部署的時候也需要算力做支撐,因此雲端人工智慧領域中以Nvidia為代表的GPU加速人工智慧成為了關注焦點,同時也有以Graphcore、Habana為代表的雲端專用人工智慧晶片公司與GPU分庭抗禮。2018年之後,隨著模型和晶片設計的最佳化,人工智慧逐漸從雲端下沉到手機等強智慧裝置終端,在手機上基於人工智慧演算法的超分辨、美顏、人臉識別等應用也漸漸得到了主流認可,相應的晶片(IP)也就成為了手機SoC上不可或缺的一部分,高通、蘋果、華為海思等都擁有自己的高效能人工智慧加速IP,用以支援手機人工智慧應用。

而隨著人工智慧技術的進一步演進,我們看到它正在進一步和物聯網結合,超低功耗人工智慧正是這個人工智慧繼續下沉的新動向。

超低功耗人工智慧晶片的應用場景

超低功耗人工智慧晶片(IP)的工作功耗在數十毫瓦或更低(作為比較,手機端人工智慧IP的工作功耗往往在數百毫瓦到瓦級別,而云端人工智慧加速卡功耗通常在數百瓦),同時往往結合事件驅動技術,即絕大部分時間計算部分都處於休眠狀態,僅僅在發生相關事件時才會啟動,這樣就可以把平均功耗降低到毫瓦數量級以下。

超低功耗人工智慧可以應用在什麼場景下呢?消費電子領域中就有超低功耗人工智慧的一席之地。在下一代智慧裝置如可穿戴裝置和智慧眼鏡類裝置中,裝置由於尺寸等原因電池容量有限,而這些裝置需要執行智慧生物訊號處理(例如智慧手錶上的心率檢測)、手勢識別(例如在目前的HoloLens中,基於人工智慧的手勢識別是主要使用者互動方式)、語音識別等等,因此需要非常高能效比的人工智慧加速模組。除此之外,在智慧家庭等領域,超低功耗人工智慧也有落地機會,例如目前的智慧門鎖市場,加入人臉識別會使智慧門鎖的使用者體驗大大改善,但是智慧門鎖通常必須依靠電池供電,而且預期的電池壽命至少要半年到一年,這樣一來對於執行人工智慧計算的模組就提出了非常高的能效比需求。

除了消費電子之外,工業應用中也需要超低功耗人工智慧。工業應用中對於超低功耗人工智慧的需求往往來源於智慧感測器。這類感測器安裝在機器、機械臂、管道等重要環境中,需要能時刻監測各類訊號並且執行相應的人工智慧演算法來判斷執行狀況。在這些場景下,感測器必須依靠電池供電,而超低功耗人工智慧可以大大減少電池消耗,這也意味著感測器更換電池的間隔可以提升,這也就大大降低了這類感測器系統的部署和維護成本。

超低功耗人工智慧晶片的技術路徑

目前,超低功耗人工智慧晶片大概可以分為三種技術路徑。

首先是基於數位電路的超低功耗人工智慧加速模組設計。使用數位電路向超低功耗方向的最佳化方法首先是從系統架構層面做最佳化,儘量減小模型的體積,並最佳化資料流以降低記憶體訪問開銷。此外,在電路層面可以降低電源電壓,甚至使用亞閾值邏輯閘設計,以降低電路執行時的功耗,以及漏電流。使用數位電路方法的優勢在於可以更容易地與人工智慧計算之外的模組整合並構成SoC,而無需在數模轉換上消耗額外能量。

第二條技術路徑是使用模擬計算來完成神經網路的計算。模擬計算往往和記憶體內計算相結合以實現高能效比,其具體的思路是目前人工智慧計算中往往儲存訪問是能量消耗最大的部分,而使用模擬計算則可以在儲存(如SRAM或Flash等NVM)讀出電路中直接做計算,這樣就省去了資料讀出再計算的步驟,而可以直接在記憶體內完成計算。使用模擬計算配合記憶體內計算往往可以實現很高的能效比,例如歐洲的著名半導體研究機構IMEC宣佈將在未來數年內完成能效比高達10000TOPS/W的模擬計算人工智慧加速模組。但是模擬計算對於模型往往有較多限制,例如必須在計算精度較低時仍然能保證準確率等,因此需要很好的軟體/硬體協同設計。
AI晶片的新風向
存內模擬計算是超低功耗人工智慧的主要技術路徑之一
第三條道路則是在模型設計上使用脈衝神經網路的設計(神經模態晶片)。使用脈衝神經網路設計的神經模態晶片僅僅在神經元被啟用時消耗能量,而絕大部分神經元在大部分情況下都處於休眠狀態而幾乎不消耗能量,因此其平均能效比可以做到比基於主流卷積神經網路的晶片高一個數量級。脈衝神經網路和神經模態晶片的難點主要在於模型設計和訓練上存在很高的門檻,此外如何對相應的脈衝神經網路模型做電路級最佳化也有很高的技術含量。

超低功耗人工智慧晶片競爭格局:中國公司佔據有利地位

超低功耗人工智慧晶片市場目前仍然處於起步階段,但是隨著未來物聯網和下一代智慧裝置的技術演進,預計在未來幾年內市場熱度會越來越高。目前,從事超低功耗人工智慧晶片開發的主要初創公司,但是未來超低功耗人工智慧晶片的下一代領導者很可能就出現在這些初創公司中。

在消費電子領域,美國的Syntiant得到了亞馬遜Alexa Fund、微軟M12和Intel Capital等行業資本的支援,其主要產品是針對智慧裝置語音處理的超低功耗晶片。與此相對,中國的初創公司在這個領域的佈局則更加多樣。來自清華大學的清微科技使用可重構電路技術,其超低功耗產品能覆蓋語音識別、視覺識別等多個領域,可望為下一代智慧裝置賦能。另一家中國公司則是SynSense,SynSense的技術路線是使用脈衝神經網路,技術來自於神經脈衝網路權威,蘇黎世大學Giacomo Indiveri教授的團隊。目前SynSense的脈衝神經網路已經完成了多次流片迭代和驗證,相關的產品覆蓋了視覺、生物訊號處理、語音識別等,平均功耗可以低至微瓦數量級。此外,SynSense還於最近推出了使用神經脈衝網路結合動態視覺感測器DVS的產品Speck,該產品能真正實現事件驅動,在絕大多數時間執行於超低的功耗下,而在檢測到動態事件後DVS能提供超高的視覺取樣頻率,並且配合脈衝神經網路實現超高效能/超低延遲的視覺訊號處理,從而兼具超低功耗和高效能。
AI晶片的新風向
而在工業應用領域,同樣來自清華大學的湃方科技走在了全球前列,成為了在工業領域能真正落地的超低功耗人工智慧演算法和晶片解決方案公司。湃方科技的應用場景涵蓋了衛星、機械臂、發電機、電機等等重要的工業應用,其晶片能提供高達50TOPS/W的能效比。

目前,在超低功耗人工智慧晶片領域,中國的初創公司和團隊無論是數量還是質量都走在了全球前列。讓我們期待中國能在未來的超低功耗人工智慧領域繼續引領全球的潮流。

相關文章