編輯 | 蘿蔔皮
聚合物電解質是下一代鋰離子電池技術的有希望的候選者。聚合物電解質的大規模篩選,受到無定形系統中分子動力學(MD)模擬的巨大成本的阻礙:聚合物的無定形結構需要多次重複取樣以降低噪聲,而緩慢的弛豫需要較長的模擬時間才能收斂。
在這裡,麻省理工學院的研究人員,使用多工圖神經網路加速篩選,該網路從大量嘈雜、未收斂的短 MD 資料和少量收斂的長 MD 資料中學習。他們實現了 4 種不同收斂特性的準確預測,並篩選了 6247 種聚合物的空間,該空間比以前的計算研究大了幾個數量級。
此外,研究人員提取了聚合物電解質的幾個設計原則,併為社群提供了一個開放的資料集。研究表明,該方法可以適用於涉及模擬複雜、無定形材料的廣泛型別的材料發現問題。
該研究以「Accelerating amorphous polymer electrolyte screening by learning to reduce errors in molecular dynamics simulated properties」為題,於 2022 年 6 月 14 日釋出在《Nature Communications》。
研究背景與困境
聚合物電解質因其低成本、安全性和製造相容性,而成為下一代鋰離子電池技術的有希望的候選者。當前聚合物電解質的主要問題是它們的低離子電導率,這限制了在實際應用中的使用。為了突破這種限制,領域內的研究人員透過實驗和原子尺度模擬探索新型聚合物。
然而,由於聚合物電解質的無定形性質及其動力學所涉及的時間尺度的多樣性,離子電導率的模擬非常昂貴,極大地限制了採用高通量計算篩選方法的能力。
請注意,儘管一些聚合物具有晶體結構,並且過去的研究已經透過密度泛函理論計算對晶體聚合物進行了大規模篩選;但篩選具有較低結晶度的聚合物,需要更昂貴的分子動力學 (MD) 模擬來對平衡結構和動力學進行取樣。
例如,最近一項探索具有經典 MD 的無定形聚合物電解質的研究,僅模擬了大約 10 種聚合物。相比之下,將機器學習方法應用於文獻資料的研究能夠探索更大的化學空間,但受到過去研究的聚合物多樣性的限制。超越已知化學空間的探索,將需要顯著加速聚合物電解質的計算篩選。
用 MD 模擬聚合物電解質的離子電導率計算成本高的主要原因有兩個。
首先,聚合物電解質的無定形結構只能使用例如蒙特卡羅演算法從隨機分佈中取樣,但由於 MD 模擬中缺乏遍歷性,這種初始結構對模擬離子電導率有顯著影響。因此,需要從獨立配置開始進行多次模擬,以正確取樣相空間並降低統計噪聲。
其次,聚合物的緩慢弛豫需要較長的 MD 模擬時間才能實現離子電導率的收斂(大約 10 到 100 ns),因此每個 MD 模擬的計算成本也很高。
切實可行的解決途徑
機器學習 (ML) 技術已被廣泛用於加速有序材料的篩選,但大多數先前的研究都隱含地假設用於訓練 ML 模型的屬性是透過確定性、無偏見的過程生成的。然而,複雜材料(如無定形聚合物)的 MD 模擬本質上是隨機的,並且由於計算成本大,透過執行重複模擬來獲得具有低統計不確定性的資料在大規模上是不切實際的。
另一種方法是降低單個 MD 模擬的精度要求,並學習使用大量成本較低但不完善的資料來減少隨機和系統誤差。之前已經證明,ML 模型可以從噪聲資料中學習並恢復影像和圖形的真實標籤。過去的工作還表明,可以透過採用遷移學習技術來學習資料集之間的系統差異。
受這些結果的啟發,麻省理工學院的研究人員希望透過採用帶有短的、未收斂的 MD 模擬的嘈雜、有偏差的模擬方案,來顯著降低模擬聚合物傳輸行為的計算成本。
圖示:聚合物空間和學習框架。(來源:論文)
在這項工作中,研究人員透過從大量有偏、有噪聲的資料和少量來自分子動力學模擬的無偏資料中學習,來加速聚合物電解質的高通量計算篩選。儘管對初始結構的依賴會導致較大的隨機誤差,但他們只對每種聚合物進行一次 MD 模擬,並學習跨聚合物的共享模型以減少隨機誤差,並恢復從重複模擬中獲得的真實特性。
為了減少長的 MD 模擬時間,他們執行了大量的短的、未收斂的 MD 模擬和少量的長的、收斂的模擬。然後,採用多工學習來學習從短模擬屬性到長模擬屬性的校正。
圖示:糾正系統錯誤的表現。(來源:論文)
研究人員發現該模型對真實屬性的預測誤差小於來自單個 MD 模擬的隨機誤差,並且它還比線性校正更好地校正了來自未收斂模擬的系統誤差。
結合隨機誤差和系統誤差的減少,研究人員成功地篩選了 6247 種聚合物的空間,並從該空間中發現了最好的聚合物電解質,與直接模擬每種聚合物的長時間模擬相比,這相當於 22.8 倍的加速度。
具體做了些什麼
研究人員透過學習減少來自多工學習框架的分子動力學模擬的隨機和系統誤差,對聚合物電解質進行了大規模計算篩選。他們的篩選表明,類 PEO 結構是一類廣泛的羰基聚合物的最佳結構。
儘管結果似乎並不令人驚訝,因為 PEO 自 1973 年被發現以來一直是最好的聚合物電解質之一,但它顯示了類 PEO 聚合物相對於非常多樣化的化學結構的優勢。聚合物候選物的唯一限制是具有羰基結構,並且結構的其餘部分是從大型藥物樣分子資料庫中隨機取樣的,幾乎沒有人為偏見。
圖示:聚合物電解質的篩選。(來源:論文)
由於 PEO 子結構自動從候選者中出現,這表明 PEO 子結構比多樣化資料庫中幾乎所有其他型別的化學結構都具有優勢,因為聚合物中存在羰基。這一結果可以解釋為什麼 PEO 仍然是最好的聚合物電解質之一,儘管在社群中努力尋找更好的候選者。對於發現比 PEO 更好的聚合物電解質,幾個潛在的方向仍然開放。
首先是尋找在非常高的鹽濃度下實現最佳電導率的聚合物電解質。電導率通常隨著鹽濃度的增加而增加,但離子聚集和擴散率降低會降低高濃度下的電導率。對於不同的聚合物,他們的篩選保持 1.5 mol/kg LiTFSI 的恆定濃度,但一些聚碳酸酯電解質在極高的鹽濃度下顯示出優勢。
其次是探索該研究之外的高分子化學。由於用於生成初始配置的蒙特卡羅程式的侷限性,他們的模擬不包括具有芳環的聚合物。最近的研究提出了具有高脆性和芳香環的聚合物作為聚合物電解質的潛力,這是由於離子電導率與結構弛豫的去耦。含有不同路易斯酸性雜原子或非羰基基序的主鏈,也可以產生更好的聚合物電解質。
大規模篩選是可能的,研究人員透過使用多工學習框架從不完美的資料中學習,顯著降低了單個模擬的計算成本。神經網路從噪聲資料中學習的能力在機器學習中得到了廣泛的研究,最近已被應用於降低材料科學中帶激發壓電響應力顯微鏡的訊雜比。
儘管在材料發現中廣泛使用圖神經網路,但對訓練資料中的隨機誤差的研究較少,這可能是因為以前的研究集中在隨機誤差小得多的簡單材料上。
圖示:減少隨機錯誤的效能。(來源:論文)
研究人員表明,即使每次模擬的隨機誤差很大,也可以透過學習跨不同化學的圖神經網路來有效減少隨機誤差。它提供了一種潛在的通用方法,以加速篩選其結構只能從分佈中取樣的複雜材料,例如無定形聚合物、表面缺陷等,因為採用該方法只需對每種材料進行一次模擬,而不是多次模擬。
這項研究中展示的系統性錯誤減少,與旨在結合不同來源資料的遷移學習研究密切相關。研究人員在這項工作中的獨特貢獻是展示了在材料篩選背景下短的、未收斂的 MD 模擬的價值。
圖示:6247 搜尋空間中聚合物的幾個描述符與預測的 50 ns MD 鋰離子電導率之間的關係。(來源:論文)
他們發現,5 到 50 ns 模擬傳輸特性之間的系統誤差可以透過少量 50 ns 模擬來糾正,這可以推廣到其他型別的材料、特性和模擬方法。因為他們的多工 GCN 架構使用 5 ns 屬性作為額外輸入來預測 50 ns 屬性,所以它在概念上也類似於 delta-learning 方法。
總之,研究人員希望在這項工作中觀察到的隨機和系統誤差減少,可以突出以前可能被忽視的不完美、更便宜的材料篩選模擬的價值。如果可以識別出廉價、嘈雜和有偏見的模擬方法,則可以使用類似的方法篩選更廣泛類別的複雜材料。
論文連結:https://www.nature.com/articles/s41467-022-30994-1