AI助力下的新材料計算,將佔據未來幾十年舞臺中心

ScienceAI發表於2021-06-02
在過去的20年裡,第一性原理模擬成為許多科學和工程領域中強大且廣泛使用的工具。電子結構方法應用廣泛,從奈米技術到行星科學,從冶金到量子材料。
鑑於目前模擬是在數字計算機上執行的,近幾十年來,其吞吐量每隔12到18個月翻一番,機器學習人工智慧正在加速搜尋和預測材料特性。
「模擬不會以驚人的方式失敗,但可以微妙地從無價到勉強到無用。但模擬是不可替代的。」模擬與計算科學的所有分支共享研究的一個關鍵要素:模擬可以複製、開放和共享,這是任何物理基礎設施永遠無法實現的。

最近,發表在《自然·材料》(nature materials)的一篇綜述「材料設計的電子結構方法 」(Electronic-structure methods for materials design)概述了模擬背後的電子結構方法及其在材料效能預測中的應用,以及用於材料設計和發現更廣泛目標的不同策略。

圖片

作者首先研究了密度泛函理論 (DFT) 的框架,並概述了可以提高準確性或擴充套件模擬範圍的日益複雜的方法。然後,討論了計算材料科學開發的功能,利用工具箱在複雜性不斷增加的現實條件下預測材料的特性。最後,強調了物理或資料驅動的方法如何為材料發現提供合理、高通量或人工智慧的途徑,並解釋這些努力如何改變整個研究生態系統。
電子結構方法
DFT
目前,DFT是有效且準確計算凝聚系統基態屬性的首選方法。是一種廣泛使用的成熟技術。儘管如此,對於材料模擬,程式碼最近才開始系統地相互驗證以確保數值精度。
對實驗的驗證具有更長的歷史,在高通量方法的幫助下,出現了許多研究,它們提供了關於彈性和電子特性預測的綜合參考資料。但預測準確性仍然是主要挑戰之一,而進步通常需要完善的特定領域知識來利用這些計算。
DFT在解決材料複雜性方面的一個關鍵優勢是:將焦點從尋找基態波函式轉移到尋找基態波函式電荷密度。缺點是DFT的通用功能是未知的,但已被證明存在。 
圖片電子結構方法。這裡捕獲了電子結構方法的複雜情況,對方法的層次進行了分組,這些方法逐步擴充套件了範圍和準確性,同時增加了成本和複雜性。(來源:論文)
密度泛函的實踐

要執行實際計算,需要解決KS方程(基態能量可以透過直接最小化總能量泛函式Evext[ρ]得到,或者等價地透過與變分原理相關的Euler Lagrange方程得到。這些被稱為Kohn-Sham方程)的數值解和近似xc泛函。

數值解涉及演算法選擇。用全電子或偽電勢處理電子-離子相互作用,可以用各種各樣的基集表示軌道和數值方法。這種多樣性轉化為當今可用的許多廣泛使用的電子結構程式碼(Table 1)。對於材料模擬,自然體現週期性的平面波方法和增強波方法是最常見的一些方法。

圖片從DFT基態計算中獲得的選定材料特性的概述。(來源:論文)

尋求xc函式近似值是更基本的問題。在最初的KS公式中已經進行了區域性密度近似(LDA)。儘管當時並不為人所知,但LDA 滿足xc孔的精確求和規則;正是這種精確的約束,以及建立非相互作用的KS系統以近似動能的直覺,使得DFT能夠以可預測的精度描述真實的材料。
LDA及其自旋解析擴充套件的改進是一個挑戰。一種方法是引入電荷密度的梯度,然後引入動能密度,同時滿足儘可能多的精確和漸近約束。或者,可以訓練更高精確度的計算,還嘗試了KS勢的直接逼近。同樣,透過絕熱連線波動耗散定理,xc泛函的質量可以得到改善,但需要大量的計算代價。
值得注意的是,在最簡單的單電子系統中,大多數泛函是不正確的。
許多近似值的區域性性質會影響其他關鍵屬性,從金屬表面的像勢到vks(r)的1 / r衰減和Rydberg級數原子和分子中的範德華相互作用。後者的相互作用對於從二維異質結構到分子和有機固體的材料尤為重要,已取得顯著進展,並且出現了經驗或第一性原理公式,極大地提高了預測準確性。
挑戰
一些對科學進步和技術創新最重要的材料仍具挑戰性。例如混合價體系、磁性材料、鑭系和錒系元素、缺陷和摻雜劑;最先進的實現通常需要對所研究的每種材料進行單獨關注。
此外,準確的新型儀器和裝置需要更多的理論發展。
材料特性和光譜學的預測
第一性原理計算材料科學的力量現已變得顯而易見,可用於研究日益複雜的材料特性和光譜學,作為指導,作者在Table 1 和Table 2 中概述了當今可以解決的現象學,提供了可用於進行這些預測的模型、理論和電子結構工具箱的指標。

圖片可以從DFT基態計算或激發態光譜公式中獲得的光譜特性的精選概述。(來源:論文)

圖片預測材料特性的一些關鍵的第一性原理方法概述。(來源:論文)

熱力學系綜和現實條件
由於高壓物理學的相關性和豐富的現象,體積和壓力不僅是在週期邊界條件下要控制的最簡單的熱力學變數,而且也是一些最強大的變數。實際上,第一性原理模擬已在高壓材料領域產生了一些早期影響,毫不費力地施加了極端條件,這在地球上的實驗中甚至是不可能的。
溫度是第一個主要的計算挑戰,因為它需要探測原子振動和運動。第一性原理分子動力學將每個原子核視為一個可區分的實體,因此得出的統計資料就是麥克斯韋·玻耳茲曼(Maxwell Boltzmann)的經典粒子之一。集體變數和元動力學使人們能夠捕獲最相關的自由度並確定其自由能態。
在合金中,可以透過計算作為化學勢函式的自由能來確定相共存和組成溫度相圖,以研究其對成分的依賴性。對多相催化劑的探索推動了對新型材料的首次高通量搜尋。
多尺度和多物理量(multiphysics)
透過多尺度或多物理模擬,可進一步拓寬第一性原理預測的材料特性範圍。晶體的勢能面適用於第一性原理計算,由於機器學習的進步,這種方法現在得到了極大的擴充套件,其中勢能面可以即時學習,適合神經網路或在基於大量一致計算的核迴歸方法中進行特徵化。最先進的方法還可以直接訪問現實奈米結構和介面屬性。
多物理模擬的一個顯著例子是遷移理論,透過主方程(例如Boltzmann或 Wigner方程)將激發的微觀動力學抽象到其種群的動力學中,並擴充套件到非平衡動力學。
結構材料見證了多尺度方法的發展,對於理解斷裂、粘附、屈服強度和其他與材料微觀結構相關的數量,第一性原理計算可以提供微觀引數。
材料光譜學
光譜學是材料表徵的核心:將精確的實驗測量與第一性原理預測相匹配,可提供驗證和理解,以及電子和原子現象及其宏觀效應之間的因果關係。Table 2中總結了第一性原理模擬可訪問的大多數技術。從廣義上講,有一些光譜可以透過 DFT 解決。
電子結構和拓撲
固體中電子的拓撲性質在凝聚態物理和材料科學中發揮著重要作用。在電子結構方法中,幾何相位隨現代極化理論出現,受計算電子極化的需要驅動,這是一個不平凡的任務,因為週期固體中的位置運算元是不確定的。
值得注意的是,現代的磁化理論的一個含義是 xc 泛函也可能取決於諸如極化的宏觀量。從Chern和量子自旋Hall絕緣體到Weyl半金屬材料的拓撲性質正透過電子結構方法進行積極研究,甚至繪製了已知材料的整個圖景。
材料設計與發現
由於第一性原理模擬的準確性和效率,以及計算能力的指數可用性,不僅使計算材料的效能範圍得到了極大的擴充套件,而且利用其設計和發現新材料已成為一個非常活躍和不斷增長的研究領域。第一性原理設計和發現的四種主要方法:模型哈密頓量,結構預測,高通量和資料驅動。 
建立模型哈密頓
在這種方法中,計算出的材料特性對映到顯式引數模型上,與直接的第一性原理計算相比,可以被更廣泛地探索。最著名的例子之一是合金理論,其形式為團簇膨脹(CE)。
在CE中,晶格上任何原子構型的能量都以Ising-like的形式寫成,即原子簇上單點自旋變數的乘積,其中每個項的係數表示該簇的有效相互作用。然後可以將所選置換安排集合的第一原理能量與CE擬合,從而產生相互作用。
最早在20世紀80年代和90年代,在CE中使用第一性原理計算,該方法已被證明適用於廣泛的系統。CE只是更廣泛的模型構建方法的一個例子,但很好地代表了利用DFT計算來引數化更簡單的哈密頓量的關鍵思想,然後可以更廣泛地進行探索。
結構預測
材料科學的基本正規化涉及結構與性質的關係:材料的結構(在長度尺度上)最終決定其性質。第一性原理計算需要結構作為輸入,因此可以透過實驗晶體結構的集合來輔助計算。
現在已經有了一套計算方法,能夠預測各種各樣的晶體結構型別,通常只使用第一性原理計算,而不使用其他輸入。由於可能的晶體結構對稱性、細胞形狀和基向量空間的維數很大,使得結構預測問題變得困難。大多數結構預測方法都基於嘗試最小化高維空間上的能量的想法,最小化是透過一個高效的最佳化演算法來實現的。
成功的方法使用了多種方法,例如遺傳演算法、粒子群方法、隨機結構搜尋等。透過將第一性原理的總能量和實驗衍射圖形的匹配相結合的成本函式最小化,這些方法也可以應用於結構解決問題。
高通量第一性原理計算
另一種成功且廣泛使用的材料設計方法是高通量 (HT) 第一性原理計算。HT從一次計算一種化合物的特性轉移到對許多化合物進行大規模計算。在極端情況下,人們甚至可以嘗試計算所有已知或預測化合物的特性。由於執行第一性原理計算的工作流程自動化,這些計算的自動化率很高,幾乎沒有或沒有人工干預,以及第一性原理方法對大部分或所有元素週期表的適用性,使得HT計算成為可能。
一些最早的 HT 計算已經結合了機器學習和資料驅動方法的想法。HT 第一性原理計算已被用於構建大型而強大的材料結構和屬性資料庫,最早的例子是 Materials Project、AFLOWlib和開放量子材料資料庫 (OQMD)。

圖片Convex hulls。(來源:論文)

在大型資料集的發現中,通常採用一種篩選策略:從大量候選化合物開始,然後應用越來越嚴格的標準來篩選最有希望的化合物。選擇標準優先考慮相對簡單且計算成本低的數量。一個常見的判據是零溫度基態相穩定性,這是透過凸包方法(convex hull approach)確定的。

圖片高通量篩選方法的例證。(來源:論文)

資料驅動的方法
機器學習和資料驅動的方法可以極大地幫助尋找新材料。材料資訊學方法通常基於三個不同的組成部分:材料資料資源;定量描述每種材料的表示;以及用於發現資料中的模式或預測新材料特性的機器學習演算法。使用HT計算進行資料收集的好處是提高系統和指數資料池的大小,電子結構和機器學習中的開源、最先進的演算法和軟體包極大地促進了工作流的發現或預測。
因此,關鍵的挑戰在於材料表示的構建。該領域通常分為兩類:一類僅是組成函式的表示,另一類是包含晶胞結構屬性的表示。
材料特性資料驅動的機器學習模型在發現具有良好效能的新材料方面已有大量的應用。許多這些模型也被用於指導HT搜尋,透過有效地將這些模型導向更有希望的化合物。實際上,透過使用機器學習大大加快了新的穩定化合物的發現速度。
展望
  • 由於模擬可以提出新材料,除了預測實驗已知材料的新特性外,關鍵挑戰是評估熱力學穩定性、合成條件、工藝性以及預測特性對內在和外在缺陷的耐受性。最終可能需要透過更高階的電子結構方法或機器學習演算法來提高DFT估計值來提高準確性。
  • 在更基本的層面上,實現模擬的預測精度和捕捉材料的真實複雜性仍然是巨大的挑戰。只有當基礎理論被理解和編碼時,模擬才能做出有意義的預測。
  • 電子結構模擬將不斷提高其相關性和影響力,加速、精簡和集中我們在材料設計和發現方面的努力,提供越來越複雜的能力來預測和表徵效能和效能,並在更加現實的條件和環境中解決那些由它們建造的裝置。
最後,作者總結:「人們常說,人類時代的起名來源於代表它們特徵的材料,而新材料的計算設計和發現,作為我們經濟和社會的技術推動者,將在未來幾十年牢牢佔據中心舞臺。無論是好是壞,如何處理它們仍然是人類的決定。」

相關文章