從頭設計「超難」癌症抗體,大衛貝克團隊AI生物計算方法的新應用

ScienceAI發表於2024-09-05

圖片

編輯 | 蘿蔔皮

原癌基因 Ras 控制多種細胞內通路,具有四種主要亞型 (KRAS4A、KRAS4B、HRAS 和 NRAS),具有高度的序列同源性和相似的體外生物化學特性。

由於它們與不同癌症的關聯各不相同,人們對獨立研究它們的作用有濃厚的興趣,但 Ras 異構體特異性結合試劑很少,因為唯一顯著的序列差異在於它們無序且高度帶電的 C 端,而這些 C 端很難引發機體產生抗體。

為了克服這一限制,華盛頓大學大衛貝克(David Baker)團隊使用基於深度學習的方法從頭設計針對 KRAS4A、KRAS4B 和 NRAS 的 Ras 異構體特異性結合劑 (RIB),而且是專門針對 Ras C 端的。

RIB 在體外和細胞內均能以顯著的特異性與其靶標 Ras 亞型結合,破壞其膜定位並抑制 Ras 活性。因此,這些工具有助於剖析 Ras 亞型在生物學和疾病中的獨特作用。

該研究以「De novo design of Ras isoform selective binders」為題,於 2024 年 8 月 30 日釋出在 bioRxiv 預印平臺。

圖片

Ras 家族 GTPases 調節絲裂原活化蛋白激酶 (MAPK) 和其他對細胞生長和存活至關重要的細胞內訊號通路,Ras 突變在許多人類癌症中很常見。四種主要的 Ras 亞型——KRAS4A、KRAS4B、HRAS 和 NRAS——具有高度序列同源性和相似的生化特性。

儘管它們有相似之處,但這些亞型在不同癌症中存在不同的突變,在耐藥性中發揮不同的作用,並且由於它們不同的無序和高度帶電的 C 末端而具有不同的亞細胞位置。

雖然 Ras GTPases 的結構部分在主要 Ras 亞型中具有 90% 的序列同源性,但 C 末端的同源性僅為 8%。所有亞型都可以定位到質膜,但是 NRAS、HRAS 和 KRas4A 在其高變 C 末端可逆地棕櫚醯化,從而實現內膜定位。

開發 Ras 異構體特異性抗體的挑戰

開發 Ras 異構體特異性抗體一直是一項挑戰;現有的抗體在免疫印跡實驗中通常會產生多條帶,不足以進行免疫染色等更靈敏的檢測。

儘管對不同 Ras 異構體進行了數十年的研究,但由於缺乏異構體選擇性分子工具(例如選擇性親和試劑),它們的具體訊號傳導活動和功能作用仍然不清楚,這使得精確的功能研究變得複雜。

蛋白質設計領域的最新進展使得研究人員能夠設計針對各種蛋白質靶標的結合物。

設計 Ras 異構體特異性結合物需要針對無序且高度帶電的 Ras C 端,因為它是 Ras 異構體之間唯一不同的區域。由於粘合劑相互作用與水相互作用的生化挑戰,針對高度極性的天然蛋白質區域(例如,KRAS4B 是 86% 極性殘基、63% 帶電殘基)一直很困難。

從頭設計新方法

針對高極性域所帶來的另一個挑戰是結合增強氫鍵或鹽橋所需的精確性質,如果做不到這一點就會導致相當大的焓損失。

貝克團隊推斷,最近開發的用於設計內在無序區域結合物的方法,可以設計出優於目前可用抗體的 Ras 異構體特異性結合物。這些試劑可以成為剖析不同異構體在細胞功能和疾病中的作用的寶貴工具。

圖片

圖示:計算設計方法。(來源:論文)

該團隊探索了兩種不同的蛋白質設計方法來設計 Ras 異構體特異性結合物 (RIB)。

第一種方法是將無序區域 (IDR) 的序列穿過來自 logos (logos 庫 A) 的 ~800 個蛋白質支架,這些支架具有特定的氨基酸識別口袋,這些口袋排列成結合一系列擴充套件構象中的不同序列。

第二種方法是透過支架 RFDiffusion 從包含來自 logos(logos 庫 B)的包裹支架的約 200 個 β 片層子集或使用序列輸入 RFdiffusion 從隨機噪聲中生成骨架,其中結合劑和靶標的骨架構象都被廣泛取樣。

在這兩種情況下,都可以透過部分 RFDiffusion、基序 RFDiffusion 和引數擾動來最佳化熱門匹配,並使用 ProteinMPNN 設計序列。

根據 Alphfold 2 (AF2) 預測置信度指標 (pae 相互作用)、預測結合親和力 (Rosetta 𝛥𝛥G) 以及無氫結合的內部極性殘基 (埋藏不飽和殘基) 的範圍選擇設計進行實驗表徵。

透過 Motif RFDiffusion(保持主幹的子集固定)、Partial RFDiffusion(稍微改變整體支架主幹)或 Parametric Perturbation(以指定的方式旋轉/移動支架主幹的一部分)來最佳化肽支架主幹。

RIBs 的計算設計

最初,該團隊嘗試使用所有方法設計針對所有 Ras 異構體的結合物。他們發現,支架法和序列輸入 RFDiffusion 方法主要產生結合物骨架,從而誘導靶標符合規則的二級結構。

這對 KRAS4A 和 NRAS C 端很有效,因為它們被誘導形成 β 鏈,並與結合劑形成延伸的 β 片層,但對 KRAS4B 和 HRAS C 末端則無效,因為它們與常規二級結構的相容性較差(KRAS4B 具有高度帶電的 6x 賴氨酸區域,而 HRAS 含有幾個間距不均勻的脯氨酸殘基)。

基於氨基酸識別口袋的方法更能成功地為所有 Ras 異構體生成良好的評分設計,因為它不需要目標中的任何二級結構傾向。

研究人員選擇了 8,317 個(5,254 個來自序列輸入,3,063 個來自支架)和 3,078 個(343 個來自序列輸入,2,735 個來自支架)使用 RFdiffusion 為 KRAS4A 和 NRAS 製作的設計進行實驗表徵,以及 2,556 個和 1,264 個使用基於氨基酸識別口袋的方法為 KRAS4B 和 HRAS 製作的設計。

圖片

圖示:RIB 表達改變 Ras 定位和訊號傳導。(來源:論文)

從頭設計的 RIB 與這些高度帶電且無序的 C 末端的結合比迄今為止描述的任何抗體5(無論是在體外還是在細胞中)具有更高的特異性。RIB 的表達增強了這些 Ras 亞型的細胞質定位,導致 Ras 活性降低,證實了 Ras 的膜結合對其功能很重要的觀點。

鑑於 Ras 在訊號傳導和疾病中的重要性,該團隊設計的 Ras 異構體選擇性結合劑應有廣泛的應用,包括異構體特異性抑制劑、靶向降解的親和力手柄、癌症患者樣本的診斷標記物和 Ras 異構體特異性生物感測器。

論文連結:https://www.biorxiv.org/content/10.1101/2024.08.29.610300v1.full.pdf

相關內容:https://twitter.com/LeoTZ03/status/1829996280892067888

相關文章