快多個數量級,清華更高精度、更泛化的深度學習電子結構計算方法登Nature子刊

ScienceAI發表於2024-10-10

圖片

編輯 | KX

兩年前,清華大學物理系徐勇、段文暉研究組開發出高效精確的第一性原理電子結構深度學習方法 DeePH,可極大加速電子結構計算。

近日,該團隊開發了一種準確而有效的實空間重構方法(real-space reconstruction),將 DeepH 方法從原先僅支援原子基組推廣至適用於平面波基組,使得 DeepH 方法可與所有密度泛函理論(DFT)程式相容。而且,該重構方法比傳統的基於投影的方法快幾個數量級。

這給深度學習電子結構計算方法帶來了更高的精度和更好的泛化能力,並打通了其利用電子結構大資料作深度學習的通道。

相關研究以「Generalizing deep learning electronic structure calculation to the plane-wave basis」為題,於 10 月 3 日釋出在《Nature Computational Science》上。

圖片

論文連結:https://www.nature.com/articles/s43588-024-00701-9

DeepH 成功與侷限性

近年來,從頭計算與 AI 相結合取得了顯著進展。這大大擴充套件了理論和計算材料研究的範圍,達到了前所未有的精度和效率。

深度學習方法 DeepH 取得了巨大的成功,在比傳統 DFT 方法快多個數量級的速度下仍能保持亞毫電子伏的精度。

然而,此類方法只支援局域原子軌道 (AO) 基組下的 DFT 程式,而完全不相容使用平面波 (PW)基組的 DFT 程式。事實上,平面波基組相對原子軌道基組有其獨特的優勢,如容易收斂、精度高、應用更廣泛等,因此將 DeepH 方法推廣至平面波基組對深度學習電子結構計算的未來發展具有重要的意義。

比傳統方法快幾個數量級

為了解決以上問題,清華研究團隊提出了一種基於 PW DFT 結果的實空間重構方法來重構 AO 哈密頓量。該方法比直接投影 PW 哈密頓量或波函式的傳統方法快幾個數量級。

此外,研究表明,使用該方法生成的 AO 哈密頓量不僅可以很好地再現 PW 電子結構,而且非常容易被神經網路模型學習。因此,解決了 PW 基下的深度學習 DFT 哈密頓量的關鍵問題。新方法的高精度和高效性有利於構建更通用、更準確的深度學習電子結構計算方法,這不僅使它們能夠為更廣泛的科學界所使用,而且極大地提高了它們在一般應用中的適用性。

圖片

圖 1:PW 基下的深度學習 DFT 哈密頓量的思想及其在旋轉雙層石墨烯中的應用。(來源:論文)

將 PW 漢密爾頓量轉換為 AO 基組的三種方法

該方法的實際工作流程為:一組小型非扭曲結構的 PW DFT 結果用於在 AO 基下重構漢密爾頓量。然後可以推廣在這些重構漢密爾頓量上訓練的神經網路來預測大型扭曲結構的漢密爾頓量。

PW 漢密爾頓量和 AO 漢密爾頓量實際上是在不同基組下表達的相同物理量。原則上,一旦有了 PW 漢密爾頓量圖片,就可以透過改變基組來獲得相應的 AO 漢密爾頓量 圖片,然後當前的 AO 漢密爾頓量神經網路可以靈活地學習該 AO 漢密爾頓量。

在此,研究人員簡要討論了將 PW 漢密爾頓量轉換為 AO 基組的三種方法。

投影(projectio)方法被廣泛用於彌合 PW 和 AO 之間的差距。其最初是為了評估 AO 基組的質量而開發的,投影方法可以修改為直接將哈密頓量從 PW 基轉換為 AO 基:

圖片

這裡,PW 基在 Born–von Kármán (BvK) 超晶胞中被歸一化:圖片,其中,k 是第一布里淵區中的波矢,G 是倒格矢,N 是形成 BvK 超晶胞的原始晶胞數,Ω 是原始晶胞的體積。AO 基函式 |ϕiα〉 以原子 i 為中心。可能有多個基函式(標記為 n)共享相同的角動量量子數 l 和磁量子數 m。指標 α 是 n、l、m 的縮寫。

方程 (1) 被稱為 Hk(G, G′) 投影法

如果得到了 PW 哈密頓量的特徵值 εnk 和波函式 |ψnk〉,則方程 (1) 可以進一步寫成:

圖片

方程 (2) 被稱為 ψnk(G) 投影法。

雖然方程 (1) 和 (2) 是將 PW 哈密頓量轉換為 AO 基的直接方法,但它們的計算效率較低。此外,它們都相對於系統中的原子數量以立方比例縮放,這限制了它們的應用範圍。

事實上,可以利用實空間中的區域性性來大大加快計算速度。原子單位下的實空間中的哈密頓量為:

圖片

其中,各個項分別對應於動能、Hartree 勢、交換關聯勢以及偽勢的區域性和非區域性部分。本研究僅考慮交換和關聯的半區域性函式。方括號中的三個項稱為總有效區域性勢:圖片,它在單位晶胞上是週期性的。一旦有了 H(r, r′),就可以直接在實空間中計算 AO 哈密頓量,如下所示:

圖片

該方法稱為實空間重構方法。

儘管它們在理論上是等效的,並且在收斂時會產生相同的結果,但所提出的實空間重構方法比前兩種基於投影的方法效率高得多。

兩個研究案例

應用於扭曲雙層石墨烯

深度學習 DFT 漢密爾頓量方法最顯著的能力是神經網路模型可以在小結構上進行訓練,並推廣到預測更大結構的漢密爾頓量。

在雙層石墨烯的研究中,訓練集由 300 個 4 × 4 雙層石墨烯超晶胞組成,這些超晶胞具有不同的堆疊和每個原子位置的隨機擾動。研究人員在根據 PW DFT 結果重建的 AO 漢密爾頓量訓練神經網路模型後,可以使用該模型系統地研究具有任意扭曲角度的莫爾扭曲超結構。

首先,在訓練集的一個結構上對重建的哈密頓量進行基準測試,將其能帶結構與使用 PW 計算的能帶結構繪製在一起。如圖 1c 所示,兩個能帶結構非常吻合。

在訓練神經網路模型後,用它來研究眾所周知的「魔角」扭曲雙層石墨烯,θ = 1.08°,莫爾超晶胞中有 11,164 個原子。有了深度學習 DFT 哈密頓量方法,計算成本可以大大降低。如圖 1d 所示,與 PW DFT 基準相比,在重建的 AO 哈密頓量上訓練的神經網路能夠給出非常準確的預測,誤差僅為幾毫電子伏。

此外,當使用從 PW DFT 輸出重建的 AO 漢密爾頓量訓練神經網路時,預測的能帶結構(圖 1d 中的 PW-NN)與 Lucignano 等人的 PW DFT 結果相比,與使用 AO DFT 計算的漢密爾頓量(圖 1d 中的 AO-NN)訓練神經網路的情況相比,具有更好的一致性。

這表明與 PW DFT 介面的深度學習漢密爾頓量確實可以給出更高精度的結果。這種高精度與 PW 方法的靈活性和廣泛適用性相結合,將大大增強深度學習從頭計算的能力,並將對未來的研究大有裨益。

應用於雙層 MoS2

接下來,在雙層 MoS2 系統研究中比較了三種方法。首先,研究人員在由六個原子組成的 AB 堆疊雙層晶胞上測試了重構方法,從重構的 AO 哈密頓量獲得的能帶結構與 PW DFT 結果非常吻合。然後,繪製了三種不同方法給出的能帶結構,它們幾乎相同,只是 ψnk(G) 投影方法給出的能帶結構與其他兩種方法略有不同,因為在方程 (2) 時僅使用了有限數量的能帶。

圖片

圖 2:應用 PW 基下的深度學習 DFT 哈密頓量研究扭曲雙層 MoS2。(來源:論文)

然後,進一步比較了三種方法的計算時間。正如預期的那樣,兩種基於投影的方法顯示出大致的立方縮放。它們甚至比完全自洽場計算更耗時。相反,由於 AO 基的區域性性,實空間重建方法實現了線性縮放,並且可以比投影方法快幾個數量級。

研究人員表示:「我們工作的一個直接影響是,使深度學習電子結構方法適用於那些已經熟悉 PW 方法但在 AO DFT 方面經驗較少的人。另一個有前途的未來應用是,建立通用的深度學習模型,可以處理不同型別的材料並準確預測它們的電子結構。」

相關文章