光神經網路,正在照亮智慧計算的未來

naojiti發表於2019-05-15

如果問一個問題——能夠進行深度神經網路計算的晶片有哪些?大家給出的答案可能五花八門:CPU、GPU、DSP、NPU……

過去幾年裡,電子計算已經成為實現人工智慧演算法——尤其是深度神經網路模型——最重要的算力支撐。儘管具體的硬體架構各有不同,但一言以蔽之,都是採用了馮諾依曼型的計算原理,即VLSI(超大規模積體電路)的“電子+邏輯”資訊處理模式,以複雜的邏輯電路和處理器晶片來完成計算任務。

但是電子方法有其先天缺陷:一是訊號之間容易相互干擾,對需要高密度連線的神經網路帶來一定的困難;二是能源需求太高,導致計算成本居高不下。

在以AI為主旋律的“數字基建”大規模爆發前夜,在算力上未雨綢繆,自然也就成了學術界和產業界共同關注的頭等大事。

最近,明斯特大學、牛津大學和埃克塞特大學的研究人員就共同實現了一項新的計算晶片,採用光學系統來幫助神經網路進行“學習”,以此實現計算、識別等行為。

光神經網路,正在照亮智慧計算的未來

不過,無論是光學計算,還是類腦晶片,類似的提法其實在學界早已有之,並且由於自身的侷限性一直進展緩慢。那麼,光學深度學習晶片的出現,是否真的突破了先天的技術桎梏,又意味著哪些新的產業機遇呢?

光學計算+深度神經網路的“攪和”歷史

在介紹新計算硬體之前,先言簡意賅地解答一下大家心中可能存在的困惑——光到底是如何進行計算的?又為什麼比電子方法更有優勢呢?

我們知道,深度學習神經網路是模仿人類大腦神經元的執行方式而來的。在每一層中,來自上一層(或者輸入源)的訊號經由神經元處理,將結果和前向訊號傳遞給下一層的神經元。

很顯然,這種計算方式需要依賴神經元之間的大量、動態的連線才能完成,會對大多數使用電子方法的積體電路造成壓力。

因此,大家紛紛開始研究其他硬體,光學晶片因此成為“全村的希望”。

光神經網路,正在照亮智慧計算的未來

2017年,MIT的研究人員就研發出了一種使用光子技術實現神經網路的方法。他們使用一系列相互連線的波導管(傳輸微波波段的電磁波裝置),來為特定的計算程式設計。而處理器則通過一系列耦合光子波導來引導光線,因此只需要運用鏡片改變光線的方向,就可以達成運算。

可程式設計、低能耗,聽起來是不是棒棒噠?不過這種方式打造的硬體準確率實在是不太令人滿意,只有77%,被傳統方法吊打的節奏啊。

不過科學家們並沒有認輸,2018年加州大學洛杉磯分校的科學家們又將光學深度學習送上了《Science》雜誌。

這次,科學家們採用3D 列印的方式製造出了一種全光學的深度學習框架D2NN。

簡單來說,研究人員訓練出了能夠識別不同資料型別的光學網路模型,併為它們分別建立了模型,該模型由多個畫素層組成,每個畫素之間如同神經元一樣進行連線,並通過光來傳輸資訊。

光神經網路,正在照亮智慧計算的未來

然後,研究人員採用五層 3D 列印塑料對模擬模型進行物理再現,固態成品的探測器就可以通過物體表面反射的光來判斷出相應的分類結果。

這種由光學元件堆疊而成的神經網路硬體,準確率能達到 91.75%,成本相對便宜,但是卻很難做到器件的小型化,難以處理複雜的資料及影像分析,而且所有引數3D列印之後就不能被再次程式設計了。

光神經網路,正在照亮智慧計算的未來

(使用 3D 列印的“人工神經網路”晶片)

總結一下就是,此前的研究都對光學計算+神經網路的解決方案提出了自己的方法,但帶來的問題多於答案,科學家們不得不繼續探索。

全光學神經突觸系統:能否重新整理光學計算的程式?

5月8日,來自德國明斯特大學的科學家將其研究成果釋出在了《Nature》雜誌上。

論文《All-optical spiking neurosynaptic networks with self-learning capabilities》(具有自學習功能的全光學尖峰神經突觸網路),提出了一種可以在毫米級光子晶片上實現的全光學神經網路。

研究人員是這麼設想的:

輸入的資料(即光波導)可以被微米級環狀諧振器調製成不同的波長,然後注入網路並停留在光學微晶片上。接著利用整合在一起的相變材料,來實現權重調製,這種物質可以由光觸發顯著的變化,非常適合模擬突觸和神經元之間的“衝動”。

光神經網路,正在照亮智慧計算的未來

資訊在光學神經網路中的傳輸,就好像是兩組人(單個波導的兩條路徑)同時在玩傳聲遊戲,需要隔的距離比較遠,來防止另一個組的聲音干擾(耦合)。同時還不能有人亂開腦洞急轉彎,免得傳話內容南轅北轍(光離開波導)。

因此,在每個組的傳話過程中,都派出一個小祕書(相變材料),根據每組任務(權重)的不同,在每次傳遞過程中(微環諧振器的入口和出口處),對隊員們向下傳遞的資訊進行微調,將被傳錯/修改的資訊復位,這樣就能最大限度地保證每個隊伍向後傳遞的資訊,既能保持差異,又足夠準確。

為了證明這一點,研究人員開發了一個由四個人工神經元和60個突觸組成的晶片。

晶片的結構由不同的層組成,分別在光奈米電路中的不同通道上傳輸光。

光神經網路,正在照亮智慧計算的未來

(分子光學神經元電路)

研究人員使用了兩種不同的機器學習演算法,分別是小規模的監督學習和無監督學習,以光脈衝的形式向後“提供”資訊,以此測試全光學神經突觸系統能否根據給定的光識別出具體的模式。

目前,研究人員已經利用該技術成功實現了光學模式識別,並展現了光子神經網路的可擴充套件性。

在此,我們可以簡單總結一下這種新光學神經網路硬體的特殊之處:

首先,它解決了前輩們沒能解決的問題——光學計算在識別準確率、可程式設計性、微型化上的缺陷——讓光學計算在計算機硬體領域的潛力帶來了新的前景。

光神經網路,正在照亮智慧計算的未來

(正在開發的光學微晶片大約只有一分錢大小)

另外,該硬體的計算方式和大腦中神經元突觸的資訊傳遞高度相似,不僅使得資訊(資料)得以在人工神經網路中傳輸,還能夠進行有效的處理和儲存。以更類似於大腦的方式處理資訊,這有助於開發更高效能的演算法,進而幫助智慧機器更好地完成現實世界的任務。

而且,該系統只在光下工作,使它充分發揮了光學計算的優勢,處理資料的速度要快很多倍,更適合用於一些大規模資料的神經網路,比如醫學診斷模型等。並且更加節省能耗。

這也就不難理解,為什麼有人認為,如果高能效的可擴充套件光子神經晶片最終出現,這一團隊的研究絕對算是開山之作了吧。

光神經網路,正在照亮智慧計算的未來

當然,想要讓可擴充套件光子神經網路系統在現實中應用,還需要做許多後續工作。

最首要的,就是增加人工神經元和突觸的數量,以及神經網路的深度,以便進一步接近和適應真實的大規模計算應用場景。

另外,晶片的製造也存在一定的限制。對此,埃克塞特大學的戴維·賴特教授表示,將使用矽技術來生產光學奈米晶片。

另一個值得關注的問題是,系統中極為關鍵的相變材料,其結晶速度會吸收並減慢光速,從而限制神經元被激發的最大速率,對於光的交叉耦合帶來一定的複雜影響。因此,每一次注入該系統的總光學功率都需要進行仔細校準,以保證材料對輸入訊號的響應完全符合預期。

不管怎麼說,儘管光學計算硬體仍然在實現層面面臨著許多挑戰和困難,規模化應用也沒有明確的時間表。但或多或少讓我們看到了更多有趣可行的計算方式,未來世界的算力資源依舊是充沛和值得期待的。

隨著智慧基建的一步步添磚加瓦,光學計算必將變得越來越重要。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2644405/,如需轉載,請註明出處,否則將追究法律責任。

相關文章