編輯 | 2049
材料創新是推動技術進步的關鍵驅動力之一。從 20 世紀 80 年代鋰鈷氧化物的發現到如今的鋰離子電池技術,材料科學的每一次突破都深刻影響著我們的日常生活。然而,傳統的材料發現方法依賴於耗時且昂貴的實驗試錯過程,而計算篩選方法雖然加速了這一過程,但仍然受限於已知材料的數量。
為了解決這一問題,微軟研究院 AI for Science 團隊開發了 MatterGen,一種基於生成式 AI 的材料設計工具,能夠直接根據設計需求生成新材料,從而大幅提升材料發現的效率。
該研究以「A generative model for inorganic materials design」為題,於 2025 年 1 月 16 日釋出在《Nature》。
研究背景
材料設計的速度直接影響著碳捕獲、半導體設計和能源儲存等領域的技術創新。傳統方法主要依賴於實驗和人類直覺,導致候選材料的測試數量有限,迭代週期長。
儘管高通量篩選(High-Throughput Screening)和機器學習力場(Machine Learning Force Fields, MLFFs)等技術的進步使得篩選數十萬種材料成為可能,但這些方法仍然受限於已知材料的數量。現有的最大規模探索僅涉及數百萬種材料,而這僅佔潛在穩定無機化合物的一小部分。
此外,這些方法難以高效地針對特定屬性進行最佳化。為了解決這些問題,逆向材料設計(Inverse Materials Design)應運而生,旨在直接生成滿足目標屬性約束的材料結構。然而,現有的生成模型在生成穩定材料、覆蓋元素範圍以及最佳化多種屬性方面仍存在顯著不足。
圖示:材料設計的篩選和生成方法的示意圖。(來源:論文)
核心理念與基礎理論
MatterGen 是一種基於擴散模型(Diffusion Model)的生成模型,專門用於設計跨元素週期表的晶體材料。擴散模型透過逆轉固定的噪聲過程生成樣本,而晶體材料由於其週期性和對稱性,需要定製化的擴散過程。MatterGen 透過逐步細化原子型別、座標和週期性晶格來生成晶體結構。
具體而言,MatterGen 定義了原子型別、座標和晶格的噪聲過程,並透過學習一個得分網路(Score Network)來逆轉這一過程。得分網路輸出原子型別、座標和晶格的等變得分,從而無需從資料中學習對稱性。這一設計使得 MatterGen 能夠生成穩定且多樣的無機材料。
圖示:MatterGen 的示意圖。(來源:論文)
具體實現方案
為了設計具有目標屬性約束的材料,MatterGen 引入了介面卡模組(Adapter Modules),用於在帶有屬性標籤的資料集上微調得分模型。介面卡模組是可調元件,能夠根據給定的屬性標籤改變模型的輸出。微調後的模型結合無分類器引導(Classifier-Free Guidance)技術,能夠生成滿足目標化學組成、對稱性或標量屬性(如磁密度)約束的材料。
MatterGen 的廣泛條件生成能力使其能夠解決多種逆向設計問題。例如,MatterGen 能夠生成具有目標化學組成、對稱性或機械、電子和磁屬性的穩定新材料。
圖示:MatterGen 和其他方法在生成穩定、獨特和新穎結構方面的效能。(來源:論文)
實驗設計與結果分析
為了驗證 MatterGen 的效能,研究團隊進行了多項實驗。
首先,生成的晶體結構在密度泛函理論(DFT)計算中表現出較高的穩定性,78% 的結構能量低於 0.1 eV/atom 的閾值。此外,生成結構與 DFT 鬆弛結構的均方根偏差(RMSD)低於 0.076 Å,表明這些結構非常接近 DFT 區域性能量最小值。在多樣性和新穎性方面,MatterGen 生成的結構中有 61% 是新穎的,且在大規模生成時仍能保持較高的多樣性。
與現有生成模型相比,MatterGen 生成的穩定、獨特且新穎(S.U.N.)材料的比例提高了兩倍以上,且生成的結構更接近其區域性能量最小值。
為了驗證 MatterGen 的實際應用效果,研究團隊與深圳先進技術研究院合作,成功合成了 MatterGen 生成的 TaCr2O6 材料。
實驗結果表明,合成材料的結構與生成的結構高度一致,且其體積模量的實驗測量值為 169 GPa,與設計目標 200 GPa 的相對誤差低於 20%。這一結果驗證了 MatterGen 的生成能力及其在實際應用中的潛力。
此外,MatterGen 在處理成分無序(compositional disorder)方面也表現出色,透過新的結構匹配演算法,能夠識別具有相同成分無序結構的不同材料,從而提高了生成的準確性和新穎性。
結語
MatterGen 的提出標誌著材料設計領域的一次重大突破。透過引入定製化的擴散過程和介面卡模組,MatterGen 能夠生成穩定、多樣且滿足多種屬性約束的無機材料。實驗結果表明,MatterGen 在生成穩定性和多樣性方面顯著優於現有方法,並且能夠透過微調滿足廣泛的屬性約束。
然而,MatterGen 仍存在一些侷限性,例如在生成較大晶體時傾向於生成對稱性較低的結構。未來的研究可以進一步最佳化去噪過程、擴充套件訓練資料集,並探索更廣泛的材料類別,如催化劑表面和金屬有機框架。隨著生成模型在影像生成和蛋白質設計等領域的成功應用,MatterGen 有望在未來幾年內徹底改變材料設計的方式。
論文連結:https://www.nature.com/articles/s41586-025-08628-5