直逼記錄極限,機器學習助力開發全新鈣鈦礦電池原料

ScienceAI發表於2024-12-27

圖片

編輯丨&

鈣鈦礦太陽能電池(PSCs),近年來成為了新興綠色環保電池的代表。而影響其效能的空穴傳輸材料(HTMs)的設計主要依賴於實驗者定性與識別 HTM 結構中的模式。

這種方法缺乏對新材料的機制理解,同時還需要在高維資料集中進行模式識別。研究人員嘗試使用機器學習(ML)結合有機合成以深入研究,試圖合成更有效的聚合物。

然而,儘管這些聚合物的不溶性特性減少了純化挑戰並豐富了資料庫,但限制了這類材料的更廣泛應用。

這些最新研究中出現的一個普遍發現是,自主最佳化演算法不僅需要足夠大的資料量,還需要資料多樣性,這就需要合成結構多樣的分子的可能性。

為了快速篩選最佳化電池所需的新型材料,團隊提出一種機器演算法模型來協助他們進行工作。該成果以「Inverse design workflow discovers hole-transport materials tailored for perovskite solar cells」為題,於2024 年 12 月 12 日刊登於《Science》。

圖片

為了獲得準確的趨勢,在均勻的器件條件下表徵這些分子的效能,需要對其中的標準器件進行基於 PTAA 的最佳化。團隊希望能夠加速新型高效能 HTMs 的發現,從而提高鈣鈦礦太陽能電池的整體效能和商業競爭力。

逆向設計工作流程

在結合了所有可用的商業單體後,團隊使用木偶聯反應規則建立虛擬的分子組合,從源資料庫中隨機選擇分子進行密度泛函理論(DFT)計算,生成包含 13,000 個分子的資料庫。隨後,他們根據特定的規則從中間資料庫中選擇分子,用於模型訓練和迭代驗證。

透過內部的高通量(HT)平臺合成、純化和表徵合成資料庫中的分子,可以將合成的分子用作 PSC 中的 HTMs,並在器件和半器件中表徵。

隨後,在 HTM 描述符和裝置引數上訓練模型。新的分子被預測、合成和實驗測量後,會被反饋到資料庫中。如此重複迭代,直到從集合中發現最佳 HTM。

圖片

圖示:逆向流程方法概述。(圖片來自論文)

在這個研究中,高斯過程(GP)迴歸被選為貝葉斯最佳化(BO)的代理模型,因為它提供了不確定性度量,而這對於貝葉斯最佳化中的採集策略至關重要。

貝葉斯最佳化策略會選擇最有潛力的新分子進行合成和實驗驗證。貝葉斯最佳化考慮了模型的預測不確定性,以平衡探索,例如尋找新的有潛力的分子和利用改進已知的高效能分子。

在某些情況下,模型可能同時預測多個效能指標(如功率轉換效率 PCE、開路電壓 Voc、短路電流密度 Jsc、填充因子 FF 等),這稱為多工學習。這種方法可以幫助識別不同效能指標之間的相關性,並可能提高預測的準確性。

透過這種工作流程,該模型能夠預測分子結構對鈣鈦礦太陽能電池效能的影響,協助團隊快速發現和最佳化高效能材料。這種方法大大加快了新材料的發現速度,並減少了傳統試錯方法所需的時間和資源。

ML模型與特徵工程

為了更好地理解觀察資料中的結構-性質關係,團隊構建了一個 ML 模型,將代表性的分子描述符與器件的 PCE 相關聯。與分類標記相反,連續分子描述符可用於提供 ML 可讀描述,其可將未見的片段整合到同一本體中。

對於 ML 模型,團隊人員尋找了一組充分捕捉裝置差異而不依賴於特定假設的描述符。為了保證代表性,他們選擇了簡單分子統計的組合,具有理論計算的特徵和幾何性質。

團隊對提取的描述符進行預處理,包括歸一化、標準化等,以確保模型能夠有效地處理這些資料。

考慮了特定原子在報導中與鈣鈦礦具有積極的相互作用,與影響空穴傳輸的因素,如分子剛性和共軛,他們選擇在101個實驗分子資料點的隨機10倍交叉驗證上訓練了不同的ML模型。

為了證明 ML 模型可以透過預測用於空穴提取的可行的新有機半導體來發現新分子,研發團隊進行了兩次閉環材料最佳化迭代。這一過程需要透過 ML 代理模型和貝葉斯選擇標準來識別潛在的候選物,自動合成候選物。

結果顯示,新系列材料產生的裝置 PCE 通常高於初始資料庫中材料的 PCE,證明了 ML 在“利用”模式下操作時相對於隨機取樣或網格搜尋方法的優勢。其中,6 個分子超過了 PTAA 的器件參考值。

在第二次迭代中,考慮到控制鈣鈦礦器件效能的眾多因素,雖然沒有發現全新的最終 HTM,但最終結果仍與第一次模擬相當。這一結果肯定了工作流程的潛力和可行性。

為了獲得準確的趨勢,在均勻的器件條件下表徵這些分子的效能,需要對其中標準器件基於 PTAA 進行最佳化。當探索材料效能的極限時,需要根據材料的特性調整器件引數

模型的探索分析

為了獲得對模型所學內容的可解釋部分的洞察能力,團隊進一步新增了實驗材料的不同特性。並且從訓練的 ML 模型中提取了特徵重要性資訊。

為了識別更具決定性的特徵,團隊決定使用遞迴特徵機(RFM)進行了特徵分析。在此之中,他們選擇使用了拉普拉斯核的推廣,該推廣結合了可學習的特徵矩陣 M 來計算資料點之間的馬氏距離。

圖片

圖示:模型分析。(圖片來自論文)

除了分子的電子性質,合成產物的純度是最終器件效能的最關鍵描述符。這一發現證實了雜質通常會降低整體效能,這是由於潛在的擴散和在相鄰層中引入陷阱或不需要的摻雜。

為了擁有一個更便於解釋的模型,他們還訓練了一個線性迴歸模型,用於將特徵空間減少到較低的子集。結果模型的評判標準採用了貝葉斯標準,八個特徵來預測 PCE。

為了讓化學家和材料科學家更清楚地瞭解發現,使他們能夠根據發現更深入地研究分子設計,研究人員決定使用化學語言來闡明 ML 的結果。特徵重要性圖突出了 HOMO(最高佔據分子軌道)的重要性和模型中叔胺(這裡通常指 TPA)的存在。

告一段落的歸納

透過強調從訓練 ML 模型中學到的雙重策略來進行總結,該模型能夠基於分子結構輸入來預測諸如器件效能這樣的複雜特性。這種模型可以在雙重策略中進一步探索。

一方面,它可以用於自主工作流程,以識別和預測進一步的新分子。另一方面,合成研究員可以使用該模型來預測特定化學空間內新分子設計的鈣鈦礦器件效能,並且該過程可以被完全訓練的模型中的設計規則集進一步指導和支援。

展望未來,團隊目標是將材料發現和裝置最佳化整合到一個無縫的閉環流程中。實現這一目標需要跨學科研究的共同努力,結合材料科學、工程和先進計算技術的見解,以建立一個協同的工作流程。

相關報導:https://techxplore.com/news/2024-12-machine-perovskite-solar-cells-efficiency.html

原文連結:DOI:10.1126/science.ads0901

相關文章