預測準確率達95.7%,ChatMOF利用LLM預測和生成金屬有機框架

ScienceAI發表於2024-06-11

圖片

編輯 | X

金屬有機框架(MOF)因其孔隙率大、表面積大和出色的可調性而用於許多化學應用。然而,在利用 AI 深入探索 MOF 設計與效能最佳化的研究征途中,科學家們正面臨著前所未有的挑戰。

去年 3 月,韓國科學技術院(Korea Advanced Institute of Science and Technology,KAIST)的研究人員提出的 MOFTransformer 模型經過一百萬個假設的 MOF 的預訓練,在預測各種屬性方面表現出色。

近日,KAIST 團隊提出了一種 AI 系統——ChatMOF,用於預測和生成 MOF。透過利用大語言模型 (GPT-4、GPT-3.5-turbo 和 GPT-3.5-turbo-16k),ChatMOF 從文字輸入中提取關鍵細節並提供適當的響應,從而無需進行嚴格而正式的結構化查詢。

ChatMOF 由三個核心元件組成(即智慧體、工具包和評估器),它形成了一個強大的管道,可管理各種任務,包括資料檢索、屬性預測和結構生成。ChatMOF 的搜尋準確率高達 96.9%,預測準確率高達 95.7%。此外,它還成功地從自然語言中建立了具有使用者所需屬性的材料。

該研究進一步探討了在材料科學中使用大型語言模型 (LLM) 與資料庫和機器學習結合的優點和侷限性,並展示了其對未來進步的變革潛力。

相關研究以「ChatMOF: an artificial intelligence system for predicting and generating metal-organic frameworks using large language models」為題,於 6 月 3 日釋出在《Nature Communications》上。

圖片

論文連結:https://www.nature.com/articles/s41467-024-48998-4

生成式 AI 領域正在經歷前所未有的激增,尤其是 LLM 的興起,它們能處理文字資料、模仿人類認知某些方面的任務,例如基於少樣本和零樣本學習來處理和應用新資訊。

儘管 LLM 在化學、醫學等領域取得進展,但在材料科學中的潛力尚未充分挖掘,主要受材料複雜性和缺乏專業訓練資料限制。這一限制主要源於兩個重大挑戰。首先,這些先進材料(如 MOF)的固有複雜性構成了重大障礙。其次,該領域材料特定的訓練資料明顯稀缺。

在此,研究人員提出 ChatMOF 用於自動生成新材料並預測其屬性。該系統能根據基於文字的查詢預測 MOF 屬性並生成具有指定屬性的 MOF (即逆向設計)。

ChatMOF 的設計

自主 LLM 智慧體的有效性取決於其能夠準確地從文字輸入中提取基本細節並提供相關響應,而不管是否存在嚴格結構化的查詢。

ChatMOF 清楚地說明了這一概念。使用者可以以文字形式提出有關材料屬性的查詢,ChatMOF 透過提供與所討論材料相關的詳細描述來響應該查詢。此外,該系統的操作範圍超出了簡單的資訊檢索。當使用者表示需要生成具有特定屬性的 MOF 時,ChatMOF 能夠相應地生成請求的材料結構。

圖片

圖示:ChatMOF 的概念和示意圖。(來源:論文)

在 ChatMOF 的背景下,LLM 充當中央協調器,管理和評估流程,類似於中央處理單元 (CPU) 在計算中的執行方式。ChatMOF 使用 LLM 系統地組織和應用各種工具來收集資訊,類似於計算機程式設計中執行良好的演算法。這種協同作用使系統能夠精確預測材料屬性,從文字挖掘資料庫中檢索合成方法,並製造具有預設屬性的新材料。

ChatMOF 由三個主要元件組成:智慧體、工具包和評估器。智慧體透過四個主要操作階段(即資料分析、操作確定、輸入管理和結果觀察)處理人類查詢。

首先,將使用者的查詢確立為目標,然後進行系統規劃以確定實現此目標的步驟。隨後,ChatMOF 從可用選項中決定使用哪種合適的工具。執行所選工具後,觀察到的結果將作為評估是否可以生成最終答案的基礎。如果可行,則提供最終答案,否則,該過程將迴圈回到思考步驟以制定新策略。

四類工具包

ChatMOF 使用各種工具來獲取、預測或生成材料資訊。這些工具主要可分為四類:表格搜尋器、網際網路搜尋器、預測器、生成器和實用程式。

如果使用者查詢有關 MOF 資料庫中包含的特定 MOF 的資訊,ChatMOF 可以從預先製表的資料中找到並提供所需的資訊。下圖為 ChatMOF 進行的表搜尋操作的說明性示例。

圖片

圖示:表格搜尋器針對問題「LITDAV 的密度與其他材料相比如何」的示例。(來源:論文)

作為預測任務的合適工具,ChatMOF 使用該小組之前開發的 MOFTransformer 模型,用於 MOF 性質的通用預測。

下圖展示了使用 MOFTransformer 預測器的 ChatMOF 示例提示。

圖片

圖示:「找到在 77 K, 1 bar 時氫擴散率最高的 MOF」問題的預測器示例。(來源:論文)

最後,MOF 領域研究人員的一個主要願望是逆向設計表現出所需特性的 MOF。遺傳演算法特別適合與 LLM 整合。作為一種受生物啟發的最佳化方法,遺傳演算法基於選擇、突變和交叉原理執行,使其具有適應性且效率高。下圖展示了 ChatMOF 利用遺傳演算法根據使用者規範製作 MOF。

圖片

圖示:針對「你能生成具有最大表面積的結構嗎」這一問題生成器的示例。(來源:論文)

此外,ChatMOF 被設計用於執行多種實用程式,這些實用程式超出了 LLM 的範圍。這包括檔案搜尋、網際網路搜尋甚至簡單計算等功能。

圖片

圖示:一個複雜且多步驟問題的示例「給出 XEGKUR 在 298 K 時的 CO2 亨利係數」。(來源:論文)

ChatMOF 效能評估

為了評估 ChatMOF 的效能,對「搜尋任務」、「預測任務」和「生成任務」進行了分析。為了進行評估,使用 GPT-4 建立了 ChatMOF 問題,以生成有關 MOF 給定屬性的各種句子。

ChatMOF 的準確性分析涉及使用三個標籤:「真」、「假(超出 token 限制)」和「假(邏輯錯誤)」。

下圖展示了使用 ChatMOF 和 GPT-4 完成的三項任務的準確度測量。對搜尋和預測任務的 100 個樣本問題和生成任務的 10 個樣本問題進行了準確性測量。ChatMOF 的搜尋準確率高達 96.9%,預測準確率高達 95.7%。對於生成任務,準確率為 87.5%。

圖片

圖示:使用 GPT-4 模型(搜尋、預測和生成)執行三個任務的準確度描述(於 2023.08.10 至 2023.08.14 測試)。

此外,ChatMOF 與 GPT-4 整合時的效能也優於與 GPT-3.5-turbo 整合時的效能。

逆向設計驗證

ChatMOF 透過規劃遺傳演算法和執行遺傳演算法進行材料逆向設計。在逆向設計方面表現出相當高的準確性(7/10),規劃過程中的主要錯誤是在選擇親本基因(parent gene)時遇到的。執行階段中,GPT-4 表現優於 GPT-3.5-turbo,能生成較少重複的後代,儘管生成數量不穩定。

圖片

圖示:ChatMOF 進行的 MOF 逆向設計分析。(來源:論文)

儘管如此,ChatMOF 已成功生成滿足使用者要求的材料,如高比表面積和指定氫氣吸附量的結構,且預測值與最佳化後實驗結果接近,顯示出方法的有效性。

侷限性

儘管 ChatMOF 取得了成功,但它的生成任務確實存在一些侷限性。其中最主要的是由於輸入和輸出 token 的限制導致基因多樣性下降。其他限制,例如拓撲和迴圈數量有限,源於資源和時間限制。

然而,儘管存在這些限制,ChatMOF 的演算法仍能有效地生成與目標函式高度一致的 MOF,證明了其操作有效性。ChatMOF 代表了在材料科學領域實現 AI 更高自主性方面取得的重大進展。隨著技術的進步,以及模型容量和線上平臺資料共享的結構化改進,ChatMOF 的效能可以進一步最佳化,從而促進 MOF 研究取得顯著進展。

相關文章