機器學習輔助催化劑設計,天大團隊開發通用且可解釋的描述符

ScienceAI發表於2024-09-26
圖片

編輯 | KX

低成本、高效的催化劑高通量篩選對於未來的可再生能源技術至關重要。可解釋的機器學習透過提取物理意義來加速催化劑設計,但面臨著巨大的挑戰。

近日,天津大學鞏金龍教授、趙志堅教授、張鵬教授團隊開發了一種通用且可解釋的描述符模型 ARSC,用於統一多種電催化反應的活性和選擇性預測。

該模型僅利用易於獲取的內在屬性,成功地解耦了雙原子位點的原子屬性(A)、反應物(R)、協同(S)和配位效應(C)。

在 ARSC 的驅動下,研究人員可以快速找到各種產品的最佳催化劑,而無需進行 50,000 多次密度泛函理論計算。

該模型的普適性已得到大量已報導的研究和後續實驗的驗證,其中 Co-Co/Ir-Qv3 被確定為最佳的雙功能氧還原和析氧電催化劑。該研究為高維繫統的智慧催化劑設計開闢了道路。

相關研究以「Machine learning-assisted dual-atom sites design with interpretable descriptors unifying electrocatalytic reactions」為題,於 9 月 17 日發表在《Nature Communications》上。

圖片

論文連結:https://www.nature.com/articles/s41467-024-52519-8

電催化反應催化劑設計

透過電催化反應活化小分子已成為實現「碳中和」的一種有前景途徑,例如 O2、CO2 和 N2 還原反應 (ORR、CRR 和 NRR) 以及析氧反應 (OER)。

雙原子催化劑 (DAC) 是單原子催化劑 (SAC) 的延伸,由於其複雜而靈活的活性位點,特別有利於電催化。然而,催化劑設計的一個重大挑戰在於開發通用描述符模型,從而準確捕捉幾何結構和電子結構之間複雜的相互作用。

當前,已經報導了許多值得注意的描述符,有效地揭示了 SAC 或 DAC 的結構-效能關係。然而,綜合考慮其可靠性、實用性和普適性,能夠統一多種反應同時解決實驗和理論結果的最佳低成本描述符仍然難以捉摸。

可解釋的機器學習 (ML) 能夠在高維繫統中提煉通用描述符模型。符號迴歸演算法是催化領域應用最廣泛的可解釋ML。識別通用描述符的關鍵在於基於物理洞察力精簡的物理特徵空間。

d 帶形狀是電子和幾何結構相互作用的結果,是從理論上理解過渡金屬表面吸附趨勢的基礎,準確量化其獨特的 d 軌道對活性的影響,對於 DAC 設計至關重要。

通用且可解釋的描述模型 ARSC

在此,天津大學研究團隊透過雙原子位點易於獲取的屬性來準確捕捉原子屬性、反應物、協同效應和配位效應。

透過物理上有意義的特徵工程和特徵選擇/稀疏化 (PFESS) 方法開發了一種通用且可解釋的描述模型 ARSC。

PFESS 的物理意義基於對 d 帶理論和前線軌道(Frontier orbitals,FO)理論的結合。它統一了多種電催化反應(ORR、OER、CRR 和 NRR)的活性和選擇性預測,並說明了 d 軌道重疊度在雙原子位點反應中的重要作用。

圖片

圖示:通用工作流。(來源:論文)

ARSC 模型框架主要包括四個部分:

(i)透過 d 帶形狀分析實現原子性質效應的原始描述符(ϕxx);

(ii)基於反應物效應的潛在理想異核 DAC 的篩選原理(ϕopt);

(iii)透過基於 ϕxx 的物理意義特徵工程和特徵選擇/稀疏化演算法實現協同效應的基於 ML 的描述符(ϕxy);

(iv)具有配位效應量化和相應實驗驗證的最終通用描述符模型(Φ)。

無需進行 50,000 多次高通量計算

研究構建了 840 個具有 3-5d 過渡金屬和四種不同配位結構(Qv1、Qv2、Qv3 和 Qv4)的同核(X-X)和異核(X-Y)DAC,驗證吸附自由能等的相關性。

然後,深入研究雙原子的原子特性與 d 帶形狀之間的關係,提出了一個原始描述符(primitive descriptor)來量化原子屬性對雙原子位點(X-X DAC)活性的影響:

圖片

其中 β 和 γ 是非負指數,由 R 和 S 對吸附的重要性決定。

計算進一步表明,FO 的形狀與 d 帶形狀密切相關,表明 FO 和所有 d 軌道都可以有效地描述 DAC 的構效關係,且精度相當。

透過繪製原始描述符 ϕxx 與 ∆G(z) − ∆Gopt(z) 的關係圖,成功統一了多種電催化反應,包括 ORR、OER、CRR 和 NRR。因此,∆G(z) − ∆Gopt(z) = 0 (ϕopt) 處的不同 ϕxx 值表示同核雙原子位點的不同有利反應和產物。

為了進一步將協同效應引入 ϕxx,執行了 PFESS 演算法,以確定一個統一多種反應的簡單通用數學公式。在簡單性、通用性和準確性之間取得平衡的多種反應的通用數學公式模型定義為 ϕxy:

圖片

其中 δ 取 1 或 −1,僅為提高擬合精度而引入,無物理意義;β 和 γ 也是非負指標,由 Rx 和 Sx 對吸附的重要程度決定;f(nx, ny) 表示 nx 和 ny 的絕對差或絕對除數,其中 nx 和 ny 的指標都只能為 0.5、1 或 2。

接著,定義了一個特徵引數 α 來量化配位效應。

圖片

其中 λ 為 X-Y 位點配位型別的指標:λ = 1 為鍵合型別,λ = −1 為非鍵合型別,說明兩種金屬共用的N原子更有利於提高非鍵合 DAC 的吸附能力,而共用的 N 原子則會阻礙物質在鍵合型別 DAC 上的吸附。Nm 為對於特定 CN(2×CN)能夠配位到整個 X-Y 位點的最大 N 原子數,Na 為相應的實際數量。

透過將 α 引入 ϕxy,提出了具有配位效應校正的 ORR 活性描述符,該描述符精確描述了雙原子位點在原子性質效應、反應物、協同和配位效應影響下的催化效能,稱為 ARSC。ARSC 定義如下:

圖片

其中 k 表示 α 的係數,物理上表示 ARSC 內配位效應的權重。它是透過數值擬合獲得的,在這裡恰好等於 1。

ARSC 模型建立在不到 4500 次 DFT 計算的基礎上,可以快速預測各種反應和產物的高活性雙原子位點,而無需進行超 50,000 次高通量計算。

圖片

圖示:ARSC 的實驗驗證。(來源:論文)

為了驗證 ARSC 預測的火山圖( volcano plot),研究人員總結了 28 篇已報導的 DAC 工作的實驗資料,其中包括 17 多個雙原子位點。

此外,作為預測的最佳雙功能 ORR/OER 催化劑,合成的 Co-Co/Ir-Qv3 不僅在實驗中顯示出 ORR 的顯著半波電位 0.941/0.937 V,而且在 10 mA cm^-2 時 OER 的過電位為 330/340 mV。

這種通用模型 ARSC 和 PFESS 方法可擴充套件到其他材料和應用。該研究為使用「玻璃盒」模型快速、高通量篩選催化劑鋪平了道路。

相關文章