準確率達 95%,機器學習預測複雜新材料合成

ScienceAI發表於2021-12-30

編輯/綠蘿

科學家和機構每年都投入非常多的資源來發現新材料,以期為燃料提供催化劑。隨著自然資源的減少,以及對更高價值和先進效能產品的需求增長,研究人員越來越多地關注到奈米材料。但識別新材料的連續實驗方法對材料發現施加了不可逾越的限制。

近日,美國西北大學和豐田研究所(TRI)的研究人員應用機器學習來指導新奈米材料的合成,消除了材料發現相關的障礙。這種訓練有素的演算法,可透過定義資料集來準確預測可用於清潔能源、化學和汽車行業燃料的重要催化劑。

該研究以「Machine learning–accelerated design and synthesis of polyelemental heterostructures」為題,於 2021 年 12 月 22 日發表在《Science Advances》雜誌上。

圖片

西北大學奈米技術專家、該論文的通訊作者 Chad Mirkin 說:「我們讓這個模型告訴我們,多達七種元素的混合物會可以製造出以前沒有過的東西。機器預測了 19 種可能性,在對每種可能性進行實驗測試後,我們發現其中 18 種預測是正確的。」

繪製材料基因組

Mirkin 此次發明的名為「Megalibrary」(巨庫)的資料生成工具極大地擴充套件了研究人員的視野。每個 Megalibrary 都包含數百萬甚至數十億個奈米結構,每個奈米結構的形狀、結構和成分都略有不同,所有這些都在 2×2 平方釐米的晶片上進行了位置編碼。迄今為止,每個晶片包含的新無機材料比科學家收集和分類的還要多。

Mirkin 的團隊透過使用一種稱為掃描探針嵌段共聚物光刻(SPBCL)的技術開發了 Megalibraries,這是一種大規模並行奈米光刻工具,能夠每秒對數十萬個特徵進行特定位置的沉積。

圖片

NP 資料集和模擬最佳化活動的統計資料。

在繪製人類基因組圖譜時,科學家的任務是識別四種鹼基的組合。但「材料基因組」包括元素週期表中任何可用的 118 種元素的奈米粒子組合,以及形狀、大小、相形態、晶體結構等引數。以 Megalibraries 的形式構建更小的奈米粒子子集,將使研究人員更接近完成材料基因組的完整圖譜。

「即使我們能比地球上任何人都更快地製造材料,這仍然是可能性的海洋中的一滴水。」Mirkin 說。「我們想定義和挖掘材料基因組,我們的方法是透過人工智慧。」

機器學習應用程式非常適合解決定義和挖掘材料基因組的複雜性,但受限於建立資料集以在空間中訓練演算法的能力。Mirkin 表示,Megalibraries 與機器學習的結合可能最終會解決這個問題,從而瞭解哪些引數會驅動某些材料特性。

化學家無法預測的材料

如果 Megalibraries 提供地圖,則機器學習提供圖例。

Mirkin 表示,使用 Megalibraries 作為用於訓練 AI 演算法的高質量和大規模材料資料的來源,使研究人員能夠擺脫通常伴隨材料發現過程而來的「敏銳的化學直覺」和連續實驗。

在這項研究中,該團隊編譯了先前生成的由具有複雜成分、結構、尺寸和形態的奈米粒子組成的 Megalibrary 結構資料。他們使用這些資料來訓練模型,並要求它預測會產生某種結構特徵的四個、五個和六個元素的組成。在 19 次預測中,機器學習模型正確預測了 18 次新材料——準確率約為 95%。

圖片

用於發現四元金屬 SINP 的閉環最佳化。

由於對化學或物理學知之甚少,僅使用訓練資料,該模型就能夠準確預測地球上從未存在過的複雜結構。

「正如這些資料所表明的,機器學習的應用,結合 Megalibrary 技術,可能是最終定義材料基因組的途徑。」TRI 的高階研究科學家 Joseph Montoya 說。

金屬奈米粒子顯示出催化工業關鍵反應的前景,例如析氫、二氧化碳(CO2)還原和氧還原和析出。該模型在西北大學建立的大型資料集上進行了訓練,以尋找具有圍繞相位、尺寸和其他結構特徵設定引數的多金屬奈米粒子,這些引數會改變奈米粒子的特性和功能。

Megalibrary 技術還可能推動對未來至關重要的許多領域的發現,包括塑膠升級回收、太陽能電池、超導體和量子位元。

該團隊現在正在使用該方法尋找對清潔能源、汽車和化工行業的燃料過程至關重要的催化劑。確定新的綠色催化劑將使廢物和大量原料轉化為有用物質。生產催化劑還可用於替代昂貴且稀有的材料。

論文連結:https://www.science.org/doi/10.1126/sciadv.abj5505

相關報導:https://phys.org/news/2021-12-machine-synthesis-complex-materials.html

相關文章