原子級精確,David Baker團隊開發RFdiffusion變體對抗體進行從頭設計

ScienceAI發表於2025-03-18

圖片

編輯 | 蘿蔔皮

抗體在現代醫學中發揮著核心作用,但目前還沒有完全在計算機中設計與特定表位結合的新型抗體的方法。相反,抗體發現目前依賴於動物免疫或隨機文庫篩選方法。

華盛頓大學 David Baker 團隊證明,結合使用微調 RFdiffusion 網路的計算蛋白質設計與酵母展示篩選,可以生成抗體可變重鏈(VHH)和單鏈可變片段(scFv),以原子級精度結合使用者指定的表位。

為了驗證這一點,研究人員使用多種正交生物物理方法(包括低溫電子顯微鏡)對四種疾病相關表位的 VHH 結合物進行了實驗表徵,證實了針對流感血凝素和艱難梭菌毒素 B (TcdB) 設計的 VHH 具有正確的免疫球蛋白摺疊和結合姿勢。對於針對流感的 VHH,高解析度結構資料進一步證實了 CDR 環構象的準確性。

雖然初始計算設計表現出適度的親和力,但使用 OrthoRep 進行親和力成熟可以產生保持預期表位選擇性的個位數納摩爾結合物。

團隊進一步展示了單鏈可變片段(scFvs)的從頭設計,透過結合設計的重鏈和輕鏈 CDR 建立 TcdB 和 Phox2b 肽-MHC 複合物的結合物。低溫電子顯微鏡結構資料證實了兩種不同的 TcdB scFv 的正確免疫球蛋白摺疊和結合姿勢,其中一種設計的高解析度資料還驗證了所有六個 CDR 環的原子級精確構象。

這種方法建立了一個框架,用於合理計算設計、篩選、分離和表徵完全新生抗體,在結構和表位靶向方面都具有原子級精度。

該研究以「Atomically accurate de novo design of antibodies with RFdiffusion」為題,於 2025 年 2 月 28 日釋出在 bioRxiv 預印平臺。

圖片

背景

抗體是蛋白質治療藥物中占主導地位的一類,目前全球已獲許可的抗體治療藥物超過 160 種,預計未來五年市場價值將達到 4450 億美元。雖然製藥界對抗體治療藥物興趣濃厚,但抗體治療藥物的開發仍然依賴於動物免疫或抗體庫篩選,以確定與目標靶標結合的候選分子。這些方法費力、費時,而且可能無法產生與治療相關表位相互作用的抗體。

抗體的計算機設計工作已將殘基移植到現有抗體結構中,取樣替代天然 CDR 環以提高親和力,並使用 Rosetta 序列設計來改善相互作用區域。基於結構和基於序列的深度學習網路已被訓練來設計新的抗體序列,但從頭(與針對該表位的現有抗體無同源性)設計結構準確的抗體仍然難以實現。

最近在使用 RFdiffusion 設計結合蛋白(不是抗體)方面取得了進展,與之前的方法不同,它不需要預先指定蛋白質結合物骨架,從而允許設計具有與使用者指定的表位固有形狀互補性的非常多樣化的結合物。

然而,與其他從頭介面設計方法一樣,這些結合劑幾乎完全依賴於與目標表位的規則二級結構(螺旋或鏈)的相互作用,因此原始(「vanilla」)RFdiffusion 網路無法從頭設計抗體。

設計從頭抗體的理想方法將能夠 1) 針對任何感興趣的靶標上的任何特定表位;2) 重點取樣 CDR 環,使框架序列和結構接近使用者指定的高度最佳化的治療性抗體框架;3) 取樣設計抗體相對於表位的替代剛體位置。

針對抗體開發的RFdiffusion變體

Baker 團隊假設應該可以開發一種專門的 RFdiffusion 變體,能夠設計從頭 CDR 介導的介面,因為 RFdiffusion 可以設計的從頭介面具有多樣性和質量,並且介面形成的底層熱力學是相同的。

RoseTTAFold2 (RF2) 和 RFdiffusion 在整個蛋白質資料庫 (PDB16) 上進行訓練,這有助於克服 PDB 包含相對較少抗體結構(約 8,100 個抗體結構,而總結構超過 200,000 個)的問題,這增加了大型機器學習模型的訓練難度。

該團隊著手開發 RFdiffusion 和 RF2 版本,專門用於抗體結構設計和結構預測,方法是對天然抗體結構進行微調。

圖片

圖示:RFdiffusion 抗體設計概述。(來源:論文)

在這裡,研究人員將原始 RFdiffusion 網路稱為「vanilla RFdiffusion」,將他們描述的抗體特定變體簡稱為「RFdiffusion」。

成功設計抗體

實驗表明,從頭設計針對目標上特定表位的抗體結構域是可能的。設計的 VHH 針對流感 HA 和 TcdB 的低溫電子顯微鏡結構資料與計算設計模型非常接近,表明該方法可以設計具有原子精度的 VHH 複合物(包括高度可變的 H3 環和整體結合方向),這些複合物與 PDB 中任何已知結構都非常不同。

圖片

圖示:設計的 VHH 的生化表徵。(來源:論文)

設計的與 TcdB 結合的 scFv 的低溫電子顯微鏡結構資料證明了 RFdiffusion 能夠準確設計雙鏈 scFv。這是首次透過實驗驗證的具有結構精確結合的從頭設計抗體案例。

另外,這種方法的成功不能歸因於記憶,因為 PDB 中不存在針對 TcdB 表位的抗體,這增強了該模型設計真正從頭結合物的能力。

圖片

圖示:兩種全新設計的 VHH 與流感血凝素和 TcdB 結合的低溫電子顯微鏡結構表徵。(來源:論文)

該團隊的計算方法與從大型隨機庫中檢索抗體的實驗篩選方法在多個方面具有協同作用。

首先,廣泛用於抗體庫篩選的酵母展示選擇方法能夠在大量設計中檢索出親和力最高的結合物,由於設計成功率很低,這一點目前是必要的。

其次,篩選結合模式相似的設計中混合重鏈和輕鏈的組合庫可以識別針對特定表位的 scFv,正如案例裡用到的 TcdB 和 Phox2b 肽 MHC。在案例中,這種方法特別有利,因為很大一部分重組體可能由於其結構相容性而具有功能性。

第三,使用 OrthoRep 進行親和力成熟可將初始 VHH 設計的測量親和力提高到個位數納摩爾或亞納摩爾範圍,同時保留原始設計的結合模式。從實際角度來看,這項工作的關鍵進展不僅在於能夠針對目標生成奈米抗體和 scFv(這通常可以透過純實驗方法實現),而且在於能夠準確靶向特定結合表位。

圖片

圖示:兩種 TcdB 結合 scFv 的低溫電子顯微鏡結構表徵。(來源:論文)

事實上,低溫電子顯微鏡研究明確證實,研究人員透過計算設計的抗體能夠以驚人的精度與目標表位結合。這種高設計精度對於治療應用至關重要,例如阻斷受體-配體相互作用的拮抗劑、避免與內源性分子競爭的抗體、誘導構象變化以觸發訊號傳導的調節劑,或靶向保守或進化受限的病毒表位的抗體。

侷限性

雖然這裡的結果表明抗體從頭設計是成功的,但仍有很大的改進空間。

對於主鏈設計步驟,結合最近的架構改進和生成建模的新進展可能會產生具有更高可設計性和多樣性的設計模型。RoseTTAFold2 和 RFdiffusion 最近也已擴充套件到模擬所有生物分子(而不僅僅是蛋白質),將此功能整合到抗體設計 RFdiffusion 中應該可以精確設計針對含有非蛋白質原子(如聚糖)的表位的抗體。

事實上,VHH_flu_01 觀察到的亞化學計量結合可以用附近聚糖 N296 的存在來解釋,而這在最初設計此 VHH 時並未考慮到。ProteinMPNN 在本研究中沒有被修改,但設計與人類 CDR 序列更接近的序列預計會降低設計抗體的潛在免疫原性和可開發性。

另外,抗體預測方法的進一步改進應該能夠更好地對上游設計方法進行計算機基準測試,並提高實驗成功率。

將 scFv 轉換為完整抗體應該很簡單,因為可變的 CDR 序列保持不變。或者,這裡使用的方法可以直接應用於 Fab 設計,只需省略重鏈和輕鏈之間的接頭即可。隨著這些進步,計算抗體設計有望成為常規方法。

結語

研究人員表示,使用 RFdiffusion 和相關方法進行抗體的計算從頭設計可能會徹底改變抗體的發現和開發。RFdiffusion 方法可以精確靶向給定抗原上的特定表位。

隨著方法的改進和成功率的提高,它有可能比免疫動物或篩選隨機文庫更快、更經濟,因為後者需要對錶位作圖和結構表徵進行廣泛的跟蹤。

基於結構的抗體設計方法能夠以結構知情的方式最佳化關鍵的藥物特性,例如聚集性、溶解性和表達水平。這允許進行有針對性的修改,同時避免可能破壞抗體-靶標介面或損害抗體穩定性的突變。

此外,從一開始就探索 CDR 環序列和結構的全部空間的能力,特別是對於 CDR1 和 CDR2,它們在體細胞超突變之前天生就侷限於種系 V 基因編碼的序列空間,應該可以簡化可開發性特徵的最佳化和非免疫顯性表位的靶向性。

科學家預計抗體的合理設計將大大增加抗體療法可處理的臨床靶點和條件的數量。

論文連結:https://www.biorxiv.org/content/10.1101/2024.03.14.585103v2

相關文章