編輯 | 2049
世界衛生組織預測,到 2050 年,抗生素耐藥性感染可能導致每年 1000 萬人死亡,超越癌症成為人類健康的首要威脅。隨著抗生素濫用導致的耐藥性問題日益嚴重,開發新型抗菌藥物已成為當務之急。
在此背景下,抗菌肽(Antimicrobial Peptides,AMPs)因其廣譜抗菌活性和低耐藥性特徵,被視為下一代抗感染藥物的希望之星。然而,傳統設計方法受限於化學空間的龐雜性,難以高效探索新型 AMPs。
現有 AI 生成模型雖能加速肽序列設計,卻面臨兩大瓶頸:生成序列多樣性不足(相似度普遍高於 0.7),且抗真菌肽研究幾乎空白。
針對這一挑戰,山東大學藥學院研究團隊創新性地將潛在擴散模型(Latent Diffusion Model,LDM)與分子動力學模擬結合,開發出 AMP 設計新正規化。實驗顯示,該方法生成的肽序列相似度低至 0.5686,其中 AMP-29 對耐藥性白色念珠菌的抑制濃度(MIC)達 6.25 μM,體內療效顯著。
該研究以「Artificial intelligence using a latent diffusion model enables the generation of diverse and potent antimicrobial peptides」為題,發表於 2025 年 2 月 5 日的《Science Advances》。
研究背景
抗菌肽透過破壞微生物細胞膜發揮殺菌作用,其多靶點機制可有效延緩耐藥性產生。AI輔助設計雖能提升開發效率,現有方法卻陷入兩難:基於篩選的模型需遍歷指數級化學空間,計算成本高昂;生成式模型雖能探索更大空間,但序列相似度居高不下,且大多數研究聚焦於抗菌肽,抗真菌肽設計研究相對較少。
究其根本,傳統生成對抗網路(GAN)和變分自編碼器(VAE)難以捕捉 AMPs 的複雜序列特徵。擴散模型(Diffusion Model)雖在影像生成中表現卓越,但其直接應用於蛋白質序列設計時,存在維度災難和特徵解耦困難。
研究團隊突破性地提出:透過潛在空間降維,將序列生成與物化屬性解耦,並引入條件約束機制,實現 AMPs 的定向生成。這一技術路徑為突破多樣性瓶頸提供了全新可能。
研究團隊構建了基於 Transformer 的雙階段架構,透過變分自編碼器將可變長度肽序列對映至 128 維潛在空間。核心創新在於引入蛋白質語言模型 ESM2 650M 進行特徵提取,使潛在變數能夠編碼高階結構資訊。
擴散階段採用 BERT 編碼器構建條件約束機制。在預訓練 48 萬條通用肽序列後,使用 1:10 的正負樣本比例進行微調,使模型能區分 AMPs 與非 AMPs。
透過調節噪聲縮放因子(Scaling Factor),模型在保持多樣性的同時,將序列與訓練集的相似度控制在 0.5686±0.0720,較其他現有方法顯著降低
圖示:基於潛在擴散模型的 AMP 生成流程。(來源:論文)
篩選機制與實驗驗證
生成後的 60 萬候選序列需經過嚴格篩選。第一級整合分類器(RNN-CNN-Transformer)以 91% 的準確率初篩潛在 AMPs;第二級透過 CD-HIT 聚類(閾值 0.6)提升多樣性;第三級結合隨機森林模型與粗粒度分子動力學模擬,預測肽-膜相互作用。
圖示:生成肽的理化性質與活性驗證。(來源:論文)
關鍵突破在於分子動力學篩選體系:透過構建 3:1 POPC/POPG 膜模型,模擬 500 ns 內肽與膜的相互作用。結果顯示,活性肽(如 AMP-24)能深入嵌入膜內並引發脂質重排,而非活性肽僅吸附於膜表面。
體內實驗中,2% AMP-29 凝膠處理 24 小時可顯著降低小鼠皮膚真菌載量;靜脈注射 AMP-24(40 mg/kg)顯著減輕肺纖維化,且心臟、肝臟未見毒性損傷。
值得注意的是,AMP-24 對革蘭陰性菌表現出獨特的作用機制:其透過形成螺旋結構平行插入膜內,引發環形孔洞效應,該機制經全原子分子動力學模擬驗證。
圖示:AMP-24與 AMP-29 的機制與療效。(來源:論文)
未來展望
本研究將潛在擴散模型應用於抗真菌肽設計,成功提高了序列多樣性。透過融合語言模型特徵編碼與多物理場篩選,實現了「生成-驗證」閉環。
然而,當前模型尚未整合二級結構等關鍵引數,導致部分候選肽存在溶血毒性。未來研究可引入強化學習,將毒性預測作為生成約束條件;同時擴充至其他型別的功能性肽設計。
論文連結:https://www.science.org/doi/10.1126/sciadv.adp7171