編輯 | ScienceAI
在基因組編輯領域,單鹼基編輯器透過將可程式設計的DNA結合蛋白與鹼基修飾酶融合,實現在不引起DNA雙鏈斷裂的情況下,對基因組中特定鹼基進行精確修改。
儘管依賴於胞嘧啶(C)鹼基編輯器(CBE)或腺嘌呤(A)鹼基編輯器(ABE)介導的脫氨反應,這些編輯器能夠實現C到胸腺嘧啶(T)或A到鳥嘌呤(G)的突變,但它們在誘導所有型別的點突變,尤其是顛換突變方面仍存在侷限性。
近期,西湖大學團隊在《Molecular Cell》上發表了一篇題為「Protein language models-assisted optimization of a Uracil-N glycosylase variant enables programmable T-to-G and T-to-C base editing」的研究文章。
這項研究首次利用蛋白質語言模型(PLM)對尿嘧啶-N-糖基化酶(UNG)進行改造,開發出高活性突變體,該突變體能夠識別正常的T和C。基於此,研究者構建了一種新型鹼基編輯器TSBE,它能夠有效地實現T到G或T到C的編輯。
研究團隊首先透過調整尿嘧啶DNA糖基化酶(UDG)的底物特異性,獲得特異性識別胞嘧啶的胞嘧啶糖基化酶(CDG)和特異性識別胸腺嘧啶的胸腺嘧啶糖基化酶(TDG)。
在nCas9和sgRNA的精確引導下,這些酶能夠切割T或C鹼基,實現一步建立無鹼基位點,在後續的DNA修復過程中產生更特異和高效的顛換突變(圖1)。
研究團隊首先將UDG變體CDG和TDG融合在SpCas9n的N端,得到的N-CDG只有較低的編輯C鹼基的能力,N-TDG編輯T鹼基的效果同樣微弱。
透過將CDG插入SpCas9n的中間得到CE-CDG,編輯C鹼基的效率大大提高,鹼基轉換以C>G為主。
然而將TDG插入SpCas9n的中間得到CE-TDG(TSBE1),編輯T鹼基的效果仍不理想(圖2)。
為了進一步最佳化TSBE,研究者採用了蛋白質語言模型(PLM)來預測和設計TDG的高活性突變體(圖3),這一策略顯著提高了TSBE的蛋白進化效率。
蛋白質語言模型借鑑了自然語言處理(NLP)中的「語言模型」概念,透過分析蛋白質氨基酸序列來預測其結構和功能。儘管蛋白質語言模型在特定酶的最佳化和分子進化中的應用尚屬首次,但其潛力已在本研究中得到驗證。
透過設計語言模型打分和排名方案,研究人員選擇出可能提高酶活性的TDG變體。透過實驗驗證突變體功能,發現在驗證的48個預測的TDG突變體中,超過50%的突變體展現出1.5-2倍的酶活性增強,成功率遠遠高於隨機誘變。
最佳化後的TSBE能在人細胞系中有效地誘導T到G或T到C的鹼基替換,並且能夠精確地糾正肥胖小鼠模型db/db胚胎的致病突變(圖 4)。
值得注意的是,近期透過隨機突變和篩選UNG突變體,也有研究成功開發出了針對C和T鹼基的顛換編輯器[1],並且某些增強TDG功能的突變與蛋白質語言模型預測的結果相一致。提示蛋白質語言模型與傳統的隨機突變和篩選方法,在蛋白質定向進化領域具有潛在的協同作用。
綜上所述,本研究的發現不僅為開發新型鹼基編輯器建立了新策略,而且還證明了利用蛋白質語言模型,無需大量特定任務訓練資料或實驗驗證,即可用於酶的分子進化的巨大潛力。這些發現將為未來的基因組編輯技術發展開闢新的道路。
參考文獻
1. Ye, L., Zhao, D., Li, J., Wang, Y., Li, B., Yang, Y., Hou, X., Wang, H., Wei, Z., Liu, X., et al. (2024). Glycosylase-based base editors for efficient T-to-G and C-to-G editing in mammalian cells. Nature Biotechnology. 10.1038/s41587-023-02050-w.
來源 /轉載於西湖大學醫學院新聞動態:https://medicine.westlake.edu.cn/News/202402/t20240221_37225.shtml