編輯 | X
當水結冰時,它會從液相轉變為固相,密度和體積等特性會發生巨大變化。水中的相變很常見,但新型材料或複雜物理系統中的相變是一個重要的研究領域。
繪製相圖通常需要大量的人類直覺和理解。如何量化未知系統中的相變通常是不清楚的,尤其是在資料稀缺的情況下。
麻省理工學院和瑞士巴塞爾大學的研究人員,將生成式人工智慧模型應用於這個問題,開發了一種新的機器學習框架,可以自動繪製新的物理系統的相圖,幾乎不需要人類監督。
研究人員基於物理的機器學習方法,比依賴理論專業知識的費力的手動技術更有效。而且不需要大量的標記訓練資料集。
例如,這樣的框架可以幫助科學家研究新型材料的熱力學性質,或檢測量子系統中的糾纏。最終,這項技術可以使科學家自主發現物質的未知相成為可能。
電腦科學與人工智慧實驗室 (CSAIL) Julia 實驗室的博士後、論文合著者 Frank Schäfer 表示:「這可能是自動科學發現新的、奇特的相特性的工具。」
該研究以「Mapping Out Phase Diagrams with Generative Classifiers」為題,於 5 月 16 日發表在《Physical Review Letters》上。
論文連結:https://doi.org/10.1103/PhysRevLett.132.207301
物理學中的相變
雖然水轉變為冰可能是相變最明顯的例子之一,但更奇特的相變,例如材料從普通導體轉變為超導體,引起了科學家的濃厚興趣。
這些轉變可以透過識別「序引數」(order parameter)來檢測,「序引數」是一個重要、預計會發生變化的數量。例如,當溫度低於 0°C 時,水會結冰並轉變為固相(冰)。
圖示:標籤 y ∈{1,2} 的二元分類問題的 (a) 判別方法和 (b) 生成方法中建模的機率分佈示意圖。(來源:論文)
過去,研究人員依靠物理專業知識手動構建相圖,利用理論理解來了解哪些序引數很重要。這不僅對於複雜的系統來說是乏味的,對於具有新行為的未知系統來說也許是不可能的,而且還會將人類的偏見引入解決方案中。
AI 檢測相變
最近,研究人員開始使用機器學習來構建判別性分類器,透過學習將測量統計資料分類為來自物理系統的特定階段來解決這個任務,就像這些模型將影像分類為貓或狗一樣。
麻省理工學院的研究人員展示瞭如何使用多體物理領域原生的生成模型來構建分類器,與判別分類器相比,該分類器可以更有效地解決相分類任務。
在數值研究中,人們通常可以直接使用生成模型來描述系統。生成方法可以使用此資訊來建立分類器,繞過判別方法中的顯式資料驅動構造。
其結果是一個強大而通用的框架,用於在具有多相的任意維引數空間中自動錶徵經典和量子相圖。
知識更豐富的模型
生成模型通常透過估計某些資料的機率分佈來工作,並使用這些資料生成適合分佈的新資料點。然而,當使用經過驗證的科學技術對物理系統進行模擬時,研究人員可以自由獲得其機率分佈模型。該分佈描述了物理系統的測量統計資料。
麻省理工學院團隊的見解是,這種機率分佈還定義了一個可以構建分類器的生成模型。他們將生成模型插入標準統計公式中,以直接構建分類器,而不是像判別方法那樣從樣本中學習。
「這是一種非常好的方法,可以將您對物理系統的瞭解深入融入到機器學習方案中。它遠遠超出了對資料樣本或簡單的歸納偏差進行特徵工程的範圍。」Schäfer 說。
該生成分類器可以確定系統在給定某些引數(例如溫度或壓力)下處於哪個相。由於研究人員直接近似物理系統測量結果的機率分佈,因此分類器具有系統知識。
圖示:方形晶格上各向異性 Ising 模型的結果。(來源:論文)
這使得他們的方法比其他機器學習技術表現得更好。而且由於它可以自動工作,無需進行大量訓練,因此他們的方法顯著提高了識別相變的計算效率。
最終,類似於人們要求 ChatGPT 解決數學問題的方式,研究人員可以向生成分類器詢問諸如「這個樣本屬於 phase I 還是 phase II?」之類的問題。或「這個樣本是在高溫還是低溫下生成的?」
科學家還可以使用這種方法來解決物理系統中不同的二元分類任務,可以檢測量子系統中的糾纏(狀態是否糾纏?)或確定理論 A 或 B 是否最適合解決特定問題。他們還可以使用這種方法,透過確定如何調整某些引數以便聊天機器人提供最佳輸出,來更好地理解和改進 ChatGPT 等大型語言模型。
未來,研究人員還希望研究理論保證,瞭解他們需要多少次測量才能有效檢測相變,並估計所需的計算量。
參考內容:https://phys.org/news/2024-05-scientists-generative-ai-complex-physics.html#google_vignette