史丹佛 AI 方法加速目標材料發現,為「自動駕駛實驗」奠定基礎

ScienceAI發表於2024-07-29

圖片

編輯 | KX

傳統的材料發現過程既耗時又成本高昂。可能的材料空間也非常大,僅由四種元素組成的材料就有超過 100 億種可能性,對於製藥應用而言,挑戰更大,大約有 10^60 種可能的類藥分子。

史丹佛大學和美國能源部 SLAC 國家加速器實驗室的科學家們,開發了一種 AI 方法,有助於在尋找新材料時更有效地收集資料,使研究人員能夠以更高的精度和速度應對複雜的材料設計挑戰。

研究人員提出了一個框架,透過簡單的使用者定義過濾演算法來捕獲實驗目標。這些演算法會自動轉換為三種智慧、無引數、順序資料採集策略(SwitchBAX、InfoBAX 和 MeanBAX)之一,從而繞過了耗時且困難的任務特定採集函式設計過程。

研究人員在 TiO2 奈米粒子合成和磁性材料表徵的資料集上證明了這種方法,表明該方法比最先進的方法效率高得多。

該研究為「自動駕駛實驗」奠定了基礎。新方法還可以快速發現新材料,這些材料可能在氣候變化、量子計算和藥物設計等領域大有可為。

相關研究成果以「Targeted materials discovery using Bayesian algorithm execution」為題,於 7 月 18 日釋出在《npj Computational Materials》上。

圖片

論文連結:https://www.nature.com/articles/s41524-024-01326-2

快速發現和合成未來材料需要智慧資料採集策略來導航大型設計空間。一種流行的策略是貝葉斯最佳化,旨在找到最大化材料效能的候選物;然而,材料設計通常需要找到滿足更復雜或更專業目標的設計空間的特定子集。

智慧順序實驗設計已成為一種快速搜尋大型設計空間的有前途的方法。與經典技術(如析因實驗設計)相比,順序方法使用在每個步驟收集的資料來減少找到最佳設計所需的總實驗次數。

當前的方法通常涉及兩個部分:(1)經過訓練的機率統計模型,用於預測設計空間中任何一點的可測量屬性的值和不確定性;(2)「採集函式」,它為設計空間中的每個點分配相對數值分數。在這種模式下,測量是在採集值最高的設計點進行的。

無論模型的準確性如何,智慧資料採集策略都會受到採集函式相關性的限制,即採集函式與使用者的實驗目標的契合程度。

在該研究中,研究人員專注於自動建立自定義採集函式以針對特定實驗目標的問題。具體來說,研究人員將考慮尋找設計空間中滿足使用者定義的測量屬性標準的「目標子集」的任務。

圖片

圖示:示例實驗目標的指定及其轉化為自動資料採集策略。(來源:論文)

在此,研究人員提出了一個用於構建採集函式的框架,該框架可以精確定位與實驗目標相對應的設計空間子集。使用者透過演算法程式定義他們的目標,如果已知底層對映,該程式將返回設計空間的正確子集。該演算法會自動轉換為可以指導未來實驗的採集函式,無需為特定應用設計複雜的採集函式。

具體來說,研究人員調整了基於資訊的貝葉斯演算法執行 (InfoBAX) 和 Multipoint-BAX 來處理材料科學場景,其特點是離散設計空間和多屬性測量。

其次,開發了一種使用模型後驗的探索策略的多屬性泛化,稱之為 MeanBAX。觀察到 MeanBAX 和 InfoBAX 分別在小資料和中資料範圍內表現出互補的效能。為此,還設計了一種無引數策略,稱為 SwitchBAX,它能夠在 InfoBAX 和 MeanBAX 之間動態切換,在整個資料集大小範圍內表現良好。

對於這三種方法,研究人員為科學家提供了一個簡單的開源介面,以清晰而簡單地表達複雜的實驗目標,實現針對材料估算問題定製的各種自定義使用者定義演算法,並重要的是,評估 BAX 框架是否適合指導實際材料實驗。

研究人員在奈米材料合成和磁性材料表徵的各種自定義目標上測試了他們的方法。結果表明,他們的方法比現有技術效率高得多,尤其是在複雜場景中。

對於奈米粒子合成示例,實驗目標為確定合成條件以開發單分散奈米粒子庫。就 Number Obtained 而言,BAX 策略明顯優於目標無關的採集函式(RS 和 US),該結果強調,將實驗目標納入資料採集過程可以使實驗測量序列更有針對性、更有效。

圖片

圖示:針對尋找單分散奈米粒子庫這一具體目標設計獲取策略。(來源:論文)

對於磁性材料資料集(真實實驗測量),引入了兩個任務:多波段和願望清單估計。同樣,與 RS、US 和 EHVI 相比,BAX 採集函式在 Number Obtained 方面表現良好。此外,BAX 策略在 Posterior Jaccard Index 指標上表現出色。

圖片

圖示:為尋找滿足多波段和願望清單目標的三元組合這一具體目標設計採集策略。(來源:論文)

領導該研究的 SLAC 和史丹佛大學博士生 Sathya Chitturi 說:「我們的方法允許你指定複雜的目標,從而實現在大型設計空間上的自動最佳化,這增加了發現新的、令人驚歎的材料的可能性。貝葉斯演算法執行框架讓你以一種簡單的方式捕捉材料設計任務的複雜性。」

例如,設計具有特定催化特性的材料的能力可以改善化學過程,從而以更高效和可持續的方式製造商品和材料,減少能源消耗和浪費。在製造業中,新材料可以增強 3D 列印等工藝,實現更精確和可持續的生產。在醫療保健領域,量身定製的藥物輸送系統可以改善治療劑的靶向性和釋放,提高療效並減少副作用。

「透過將先進的演算法與有針對性的實驗策略相結合,我們的方法使發現新材料的過程變得更容易、更快捷,」合作者、史丹佛同步輻射光源 (SSRL) 材料科學部主任 Chris Tassone 說。「這可以在許多行業帶來新的創新和應用。」

參考內容:https://phys.org/news/2024-07-ai-approach-materials-discovery-stage.html

注:封面來自網路

相關文章