提高光學資料集利用率,天大團隊提出增強光譜預測效果 AI 模型

ScienceAI發表於2024-05-22
圖片

編輯 | 枯葉蝶

近日,天津大學鐳射與光電子研究所吳亮副教授、姚建銓院士團隊聯合自然語言處理實驗室熊德意教授團隊報導了一種使用多頻率補充輸入的深度學習模型來增強光譜預測效果的方案。

該方案可有效地提高現有光學資料集的利用率,在不額外增加訓練成本的基礎上,增強了與超表面結構對應的光譜響應的預測效果。

相關研究成果以「Enhanced spectrum prediction using deep learning models with multi-frequency supplementary inputs」為題,於 2024 年 5月16 日發表在《APL Machine Learning》。

圖片

論文連結:https://doi.org/10.1063/5.0203931

研究背景

近年來,深度學習技術的快速發展為各個領域帶來了前所未有的變革和創新,成為了多門學科處理複雜且龐大的資料的有效工具。

基於神經網路的方法可以有效地檢測目標資料的相關特徵和潛在模式,但如果深度學習模型直接學習這些來自不同領域、不同格式的相關資料仍存在一定的挑戰。

特別的,近年來結合深度學習技術的研究領域普遍面臨著現有資料集的體量小、質量低等問題,影響了模型對於目標任務的學習效果。

在整個「AI for Science」的研究過程中,耗費成本最高的部分主要是資料集的構建,因此,如何更有效地利用現有資料集至關重要。

天津大學團隊經研究證明,在目標頻譜預測過程中向現有資料集新增補充的多頻輸入資訊,可以顯著提高網路的預測準確率。這種方法為深度學習和光子學、複合材料設計和生物醫學等其他領域的跨學科研究和應用提供了新的資料集使用思路。

研究亮點

研究的創新點在於提出了全頻率範圍的光譜資訊拆分思想,表現為結合實際設計需求,將全頻率光譜資訊按照工作頻率部分及非工作頻率部分進行學習任務拆分。

為展示該方案的普適性,工作中將目標工作頻段細化為低頻資訊 (0-1 THz)部分和高頻資訊 (1-2 THz)部分來演示模型學習的增強效果。

與對該工作頻率範圍資料進行直接預測相比,在補充了其他頻率資訊後,整體的透射光譜資料預測誤差下降了 80% 左右,其中基於 Transformer 的模型在補充低頻資訊後,預測誤差僅為直接預測的 40% 左右,設計的超表面結構和模型架構如圖一所示:

圖片

圖1 (a)-(b) 超表面結構示意圖,其中棕色部分代表「1」畫素,黃色部分代表「0」畫素。(c) CNN、LSTM、GRU 和 Transformer 網路示意圖,正向網路中,模型的輸入是25*25畫素的超表面矩陣,輸出是光學響應,而逆向網路則相反。其中圖中標註的「H」和「L」分別代表高頻和低頻的相關振幅和相位資料。

為更直觀的展示最佳化後不同工作頻率下振幅及相位參量的預測效果,這裡隨機選取一些超表面結構在 CST Studio Suite 軟體中進行模擬演示,如圖二所示:

圖片

圖2 最佳化後高頻和低頻資料的預測效果示意圖。(a)-(f) 透過將真實資料(紫色實線)與預測資料(黑色虛線)進行比較,證明最佳化網路模型在不同頻率範圍內的不同預測效能。綠色區域表示用作補充輸入的頻率資訊資料,而黃色區域表示用於驗證最佳化預測效能的區域。其中a和b代表x偏振態高頻和低頻振幅的預測結果。(c)-(d) y偏振態高頻和低頻振幅的預測結果。(e)-(f) 高頻和低頻相位的預測結果。

總結與展望

該研究透過對不同光學問題的學習任務進行有針對性的資料集拆分,有效地提高了現有資料集的利用效率,進而提升了深度學習模型的學習效果。

這一最佳化方案有效緩解了現有光學資料集(特別是太赫茲波段的相關資料集)較少的問題,也為更多結合深度學習技術但資料昂貴的研究領域,如複合材料設計、醫學影像分析、金融資料預測等提供了一種對資料集進行最佳化的新視角。

第一作者:邢效華,任玉琪 指導教師:吳亮,熊德意,姚建銓
論文合作者:鄒蝶,張乾坤,毛炳軒
致謝:張霜教授(香港大學)、韓家廣教授在論文工作過程中的幫助。相關研究受到國家重點研發計劃、國家自然科學基金等專案支援。
通訊員:張乾坤 史森方

相關文章