作者/凱霞
化學元素幾乎構成了物理世界中的一切。迄今為止,化學家們已經發現了 118 種元素,元素的氧化態是衡量一個元素化學性質的重要指標之一。儘管弄清楚單個元素的氧化態非常簡單,但當涉及由多種元素組成的化合物時,事情就變得複雜了。
近日,來自洛桑聯邦理工學院(EPFL)的研究人員訓練了一組機器學習 (ML) 模型,自動將氧化態分配給金屬有機框架(MOF)中的金屬離子。該方法有很好的準確性。說明機器學習可捕獲集體知識(collective knowledge )並將其轉換為令人驚訝的強大工具。
該研究以「Using collective knowledge to assign oxidation states of metal cations in metal–organic frameworks」為題,於 7 月 5 日發表在《Nature Chemistry》期刊上。
元素週期表中每一種元素都有一個編號(例如:O 是 8),大小恰好等於該元素原子的核電荷數(質子數),這個編號稱為原子序數。質子數基本上決定了元素的本質並賦予它化學性質。簡而言之,原子序數是一種元素的「身份證」。
氧化態是理解材料特性和反應性的重要概念。表示一個化合物中某個原子的氧化程度。
氧化態對於平衡氧化還原反應,幫助化學家系統化和解釋(氧化還原)反應性以及光譜特性等至關重要。例如,高錳酸鹽 (Mn(vii))具有很強的氧化性,通常呈紫色,而 Mn(ii) 化合物的反應性較低,通常是無色的。
元素週期表應包括氧化態
劍橋結構資料庫(Cambridge Structural Database,CSD)—— 一個晶體結構庫,其中氧化態以材料的名稱給出。「資料庫非常混亂,有很多錯誤,混合了實驗、專家猜測和鍵價理論的不同變體,用於指定氧化態,」領導這項研究的 Berend Smit 教授說。「我們假設化學是自我修正的,」他補充道。「因此,雖然個人賬戶存在很多錯誤,但整個社群都會改正。」
EPFL 基礎科學學院的化學工程師研究了元素週期表中每個元素必須報告的另一個數字:元素的氧化態,也稱為氧化數。簡單地說,氧化態描述了一個原子必須獲得或失去多少電子才能與另一個原子形成化學鍵。
「在化學中,氧化態總是以化合物的化學名稱報告,」 Smit 說。「氧化態在化學基礎中發揮著重要的作用,有些人認為它們應該被表示為元素週期表的第三維。」
複雜的材料使事情複雜化
但是,儘管弄清楚單個元素的氧化態非常簡單,但當涉及由多種元素組成的化合物時,事情就變得複雜了。「對於複雜的材料,實際上不可能根據第一原理預測氧化態,」Smit 說。「事實上,大多數量子程式都需要金屬的氧化態作為輸入。」
目前預測氧化態的最新技術仍然基於 20 世紀初開發的一種稱為「鍵價理論」的東西,該理論根據組成元素原子之間的距離來估計化合物的氧化態。但這並不總是有效的,尤其是在具有晶體結構的材料中。「眾所周知,不僅距離很重要,金屬配合物的幾何形狀也很重要,」Smit 說。「但考慮到這一點的嘗試並不是很成功。」
機器學習解決方案
在這項研究中,研究人員解析了 CSD 中金屬中心氧化態的化學名稱,對區域性化學環境進行了數字編碼(特徵化),並訓練了一組機器學習 (ML) 模型,該模型基於四個基本模型之間的「投票」進行預測,對氧化態進行分配。
使用的特徵向量結合了化學家認為氧化態關鍵的三個方面:金屬型別、配位環境的幾何形狀和化學環境。重要的是,這種特徵化基於化學見解,但提供了靈活性以適應經典規則失敗的情況。
圖示:特徵化方法的示意圖。(來源:論文)
為了評估 ML 方法和鍵價方法的效能,計算了方法預測的準確性以及敏感性的度量。對於銅(Cu),氧化態 I 和 II 在 CSD 的 MOF 子集中得到了很好的體現(CSD 中的頻率:Cu(I),24.2%;Cu(II),75.8%)。假設 Cu 的所有氧化態都是 II,ML 方法已經有 75.8% 的成功機會。研究表明 ML 模型在所有指標上都優於基線和鍵價方法。
圖示:MOFs 中 Cu 氧化態分配的效能指標。(來源:論文)
ML 方法適用於所有金屬,但對於當前訓練集中不太常見的金屬和氧化態的準確度較低。對於元素週期表的 s 區元素(例如 Li、Na 和 Ca),所有氧化態都被正確分配。即使對於更具挑戰性的 d 區(例如 Fe 和 Cu)、p 區(例如,Al、Pb 和 Bi)和 f 區元素(例如、Ce、Eu 和 Ho),也獲得了至少 90% 的成功率。
ML 模型的另一個優點是它們可以提供對預測可靠性的估計。對 p 區和低價 d 區和 f 區金屬實現了近乎完美的預測。
圖示:整個週期表的預測效能。(來源:論文)
例項研究
該研究重點預測了 MOF 中金屬中心的氧化態,特別是混合價 MOF 和柔性 MOF。
混合價 MOF Cu(I/II) 苯-1,3,5-三羧酸酯 (BTC):使用該模型來確定這些混合價 MOF 中每個金屬位點的氧化態。分別確定了 Cu(I/II) BTC 晶胞中 16 個金屬位點中每一個的氧化態,與實驗資料一致。
圖示:混合價 MOF Cu(I/II)–BTC 氧化態的預測。(來源:論文)
對柔性 MOF MIL-47 也取得了很好的預測。
圖示:MIL-47 活化前(合成時)和活化後氧化態的預測。(來源:論文)
除此以外,ML 方法還可預測尚未在 CSD 中的新型 MOF 的合理氧化態。
該研究提供了一個應用程式,它使用我們的預訓練模型將氧化態分配給材料雲 (go.epfl.ch/oximachine) 上 MOF 中的金屬中心。該應用需要晶體結構作為輸入,並輸出不同金屬位點的氧化態以及置信度估計值。此外,該程式可以提供特徵重要性的詳細資訊。
研究人員表示:「儘管我們在這項工作中的主要重點是預測 MOF 中金屬中心的氧化態,但我們也證明了僅在 MOF 上訓練的模型可以轉移到其他型別的材料,例如二元離子固體或簡單金屬複合體。」
「我們基本上製作了一個機器學習模型,它捕捉了化學界的集體知識,」 Kevin Jablonka 博士說。「我們的機器學習無非是電視遊戲《誰想成為百萬富翁?》(Who Wants To Be A Millionaire?)。如果化學家不知道氧化態,其中一條生命線就是問化學觀眾,他們認為氧化態應該是什麼。透過上傳晶體結構和我們的機器學習模型,化學家的聽眾會告訴他們最可能的氧化態是什麼。」
論文連結:https://www.nature.com/articles/s41557-021-00717-y
參考內容:https://phys.org/news/2021-07-machine-oxidation-states-crystal.html