編輯 | KX
分子表徵已經從「圖」擴充套件到「影片」了。
兩年前,湖南大學的研究團隊,開發了具有化學意識的深度學習框架 ImageMol,用於從大規模分子影像中學習分子結構,可準確預測分子特性和藥物靶點。
現在,該研究團隊將 ImageMol 進行了重大升級,提出一個基於分子影片的基礎模型,稱為 VideoMol,該模型在 1.2 億幀的 200 萬個未標記的類藥物分子和生物活性分子上進行了預訓練。
VideoMol 是一個新穎的分子表徵學習框架,與以往基於序列、圖和影像的分子表徵學習方法有顯著不同。VideoMol 將分子視為動態影片,以影片處理的方式學習分子表徵,這意味著大量影片表徵學習技術可用於分子表徵學習。
與之前的 ImageMol 相比,VideoMol 有幾個實質性的升級:
(1)分子視覺表徵的內容由二維畫素資訊升級為三維畫素資訊;
(2)分子預訓練由基於圖的學習升級為基於影片的學習;
(3)包含的指紋資訊由之前的 1 個指紋(MACCS 鍵)升級為 21 個指紋。
由於 VideoMol 涉及影像表徵學習、影片表徵學習、多視角表徵學習等研究領域,因此具有更大的研究潛力,可以激勵更多研究人員進行更大的效能改進。
相關研究以「A molecular video-derived foundation model for scientific drug discovery」為題,於 11 月 8 日釋出在《Nature Communications》上。
藥物發現是一個複雜且耗時的過程,包括潛在藥物靶點的識別、化合物設計和合成、化合物的功效和安全性測試。
計算藥物發現使用計算和人工智慧技術來協助藥物開發,可以大大減少傳統藥物發現和開發的時間和成本。
對數億種化合物進行精確的分子表徵是計算藥物發現介面臨的一項重要挑戰。隨著深度學習和自監督學習的興起,自動化分子表徵學習方法可以透過對大規模分子資料集進行預訓練,從分子序列、圖和影像中提取表徵。這些方法在藥物發現的各種任務中表現出顯著的效能提升。
基於影片表徵學習和計算機視覺自監督學習的最新進展,基於自監督影片的預訓練模型為進一步提高藥物發現的效能提供了機會。
VideoMol 框架:1.2 億幀的 200 萬個分子
分子存在於自然界中,不斷進行構象動態變化,影片是最直接的表示方法。無需人工提取特徵,即可從影片中直接觀察到分子的三維資訊,例如原子對之間的距離、多個原子之間形成的夾角等。
具體來說,VideoMol 利用動態感知(dynamic awareness)和物理化學感知,以無監督的方式從大量分子 3D 動態影片中學習分子表徵。VideoMol 從 200 萬個具有人類蛋白質組多種生物活性的分子影片的 1.2 億幀中捕獲化合物的物理化學資訊。
研究人員評估了不同表示在特徵提取能力上的優勢,發現所提出的影片表示比現有表示具有明顯的優勢,在 8 個基本屬性上的提升率為 39.8%。因此,這些顯著的差異促使研究人員開發了 VideoMol,以分子衍生影片的形式準確預測分子的靶點和性質。
首先,為 200 萬個類藥和生物活性分子生成構象,併為每個 3D 分子渲染 60 幀的動態影片(共 1.2 億幀)。然後,將分子 3D 影片輸入影片編碼器以提取潛在特徵,並實施三種預訓練策略,透過考慮影片的變化和分子的物理化學資訊來最佳化潛在表示。最後,在下游任務(分子靶標和屬性的預測)上對預訓練的影片編碼器進行微調,以進一步提高模型效能。
VideoMol 透過使用梯度加權類啟用對映(Grad-CAM)實現了良好的可解釋性,透過熱圖視覺化分子影片對預測結果的貢獻。
為了全面評估 VideoMol 的效能,研究人員選擇了四類任務:(1)化合物激酶結合活性預測,(2)配體-GPCR(G 蛋白偶聯受體)結合活性預測,(3)抗 SARS-CoV-2 活性預測,(4)分子特性預測。
研究表明,VideoMol 是一種有效的基於分子影片的表徵學習方法,在多種藥物發現任務中表現優於最先進的方法。
發現配體-受體相互作用
接下來,研究人員透過 VideoMol 識別 4 個眾所周知的人類靶標的新型配體-受體相互作用:β-分泌酶 1 (BACE1)、環氧合酶 1 (COX-1)、COX-2 和前列腺素 E 受體 4 (EP4),從而評估該模型的通用性。
此外,還驗證了 VideoMol 在 4 個靶標(BACE1、COX-1、COX-2 和 EP4)的虛擬篩選中的高精度,這與正在進行的臨床和實驗資料一致。
與 ImageMol 相比,VideoMol 在這 4 個靶標上實現了 38.1% 的平均精度提升,這表明 VideoMol 能夠推廣到外部驗證集。特別是在 COX-1、COX-2 和 EP4 抑制劑的虛擬篩選中,VideoMol 取得了明顯的優勢,證明了 VideoMol 可以克服資料不平衡(ChEMBL 的 COX-1 和 COX-2 的不平衡率為 0.043 和 0.253)和資料稀缺(ChEMBL 的 EP4 僅有 350 個樣本)的情況。
影片視覺化和模型可解釋性
由於分子影片中的每一幀都代表同一個分子,因此它們在特徵空間中的投影應該相似。
為了評估 VideoMol 對分子影片的判別能力,研究人員隨機選擇了 100 個分子影片並提取影片中每一幀的特徵。隨後,使用 t-SNE 將每個特徵投影到二維空間中。來自同一影片的幀很好地聚類在一起,而來自不同影片的幀則明顯分開。透過定量評估這些聚類的 DB(Davies Bouldin)指數。VideoMol 實現了較低的 DB 指數(值為 0.197),表明 VideoMol 具有識別同一分子的不同幀的能力。
研究人員分別從相同和不同的分子影片中隨機抽取 10,000 對分子幀,並計算這些配對樣本之間的餘弦相似度。正如預期的那樣,影片內的平均相似度很高(88.3%),而影片間的平均相似度幾乎為零(0.5%),這表明 VideoMol 對同一分子的不同 3D 檢視具有穩健性。
在 VideoMol 的可解釋性方面,研究發現,VideoMol 對同一影片不同幀的注意力不同,這是由於視角遮擋問題導致有用資訊經常分散在不同的檢視中。這顯示了分子影片的優勢,使 VideoMol 能夠透過掃描每一幀來了解更多的分子資訊。此外,值得注意的是,VideoMol 可以感知遮擋場景中的子結構。
研究人員相信,隨著分子成像技術的不斷進步,透過影片來表示分子並進行推理很有前途。總而言之,VideoMol 的推出,一方面豐富了計算藥物發現領域的分子表徵形式,另一方面啟發人們從不同角度學習和理解分子。
注:封面來自網路