編輯 | 蘿蔔皮
抗生素耐藥性感染每年在全球造成約 127 萬人死亡,預計到 2050 年,如果沒有特效的新藥,每年死亡人數將達到 1000 萬人,因此需要採取緊急措施來應對抗生素耐藥性。
賓夕法尼亞大學的校長助理教授(Presidential Assistant Professor) Cesar de la Fuente 說:「即使感覺身體好些了,也要確保完成抗生素療程,這是許多人聽過,但經常忽視的醫學口頭禪。」
他解釋道,這句話至關重要,不遵守規定可能會影響抗生素的使用功效。「近幾十年來,這導致了耐藥細菌的增加,全球健康危機日益嚴重,每年造成約 495 萬人死亡,甚至可能使普通感染也致命。」
De la Fuente 和復旦大學、賓夕法尼亞大學的研究人員組成的跨學科研究團隊,一直致力於研究應對抗生素耐藥性問題。
在一項發表的新研究中,他們開發了一種人工智慧工具來挖掘龐大且基本上未開發的生物資料——超過 1000 萬個現代和已滅絕生物的分子——以發現新的抗生素候選藥物。
該研究以「Deep-learning-enabled antibiotic discovery through molecular de-extinction」為題,於 2024 年 6 月 11 日釋出在《Nature Biomedical Engineering》。
「採用傳統方法,開發治療感染的新型臨床前候選藥物大約需要六年時間,這個過程非常艱苦且昂貴。」De la Fuente 說。
「我們的深度學習方法可以大大縮短時間,降低成本,因為我們在短短几個小時內就確定了數千種候選藥物,而且其中許多藥物具有臨床前潛力,這在我們的動物模型中進行了測試,標誌著抗生素發現的新時代的開始。」
最新發現建立在 De la Fuente 自 2019 年來到賓夕法尼亞大學以來一直研究的方法的基礎上。該團隊提出了一個基本問題:能否利用機器透過挖掘全球生物資訊來加速抗生素的發現?
他解釋說,這個想法基於這樣的觀念:生物學從最基本的層面上來說是一個資訊來源,理論上可以利用人工智慧進行探索,以尋找新的有用分子。
該團隊首先應用簡單的演算法來挖掘單個蛋白質,以找到隱藏在其氨基酸序列中的小抗生素分子。隨著計算能力的進步,De la Fuente 意識到他們可以將挖掘單個蛋白質擴充套件到挖掘整個蛋白質組。
他說,他們能夠挖掘「整個蛋白質組,即生物體基因組中編碼的所有蛋白質,這使我們在人類蛋白質組中發現了數千種新的抗菌分子,後來又在尼安德特人和丹尼索瓦人等古代類人猿的蛋白質組中發現了數千種新的抗菌分子。
「然後,我們挑戰自己,挖掘科學界已知的所有滅絕生物。」他說。
「分子復活」技術
De la Fuente 團隊開發出了所謂的「分子復活」技術,即復活已經滅絕的具有潛在治療作用的古代分子,並因此在古代生物的基因組中發現了治療分子。他們推測,他們發現的許多分子可能在整個進化過程中為宿主的免疫發揮作用。
該研究以「Discovery of antimicrobial peptides in the global microbiome with machine learning」為題,於 2024 年 6 月 5 日釋出在《Cell》。
研究人員在《Cell》的這項研究中提出了一種基於機器學習的方法,來預測全球微生物組中的抗菌肽 (AMP),並利用來自環境和宿主相關棲息地的 63,410 個宏基因組和 87,920 個原核生物基因組的龐大資料集來建立 AMPSphere,這是一個包含 863,498 種非冗餘肽的綜合目錄,其中很少有與現有資料庫匹配的肽。
AMPSphere 提供了肽進化起源的見解,包括透過複製或較長序列的基因截斷,研究人員觀察到 AMP 的產生因棲息地而異。
為了驗證預測,研究人員合成了 100 種 AMP,並在體外和體內測試了它們對臨床相關的耐藥病原體和人類腸道共生菌的作用。
總共有 79 種肽具有活性,其中 63 種針對病原體。這些活性 AMP 透過破壞細菌膜表現出抗菌活性。總之,這種方法確定了近一百萬個原核 AMP 序列,這是一種抗生素發現的開放資源。
抗生素肽去滅絕
在《Nature Biomedical Engineering》的研究中,研究人員展示了深度學習可用於挖掘所有可用的滅絕生物的蛋白質組,以發現抗生素肽。
De la Fuente 團隊訓練了由肽序列編碼器和神經網路組成的深度學習模型組合,稱為抗生素肽去滅絕(APEX),用於預測抗菌活性,並用它來挖掘 10,311,899 種肽。
De la Fuente 實驗室的博士後研究員 Marcelo Der Torossian Torres 表示,團隊在構建 APEX 時,首先建立了一個「高度標準化的資料集來訓練它,而這在文獻中是缺失的……這令人驚訝,因為有如此多的資料集,研究人員將使用多組資料集,假設所有樣本都是以非常系統、一致的方式收集的,但情況並非總是如此。」
他說,APEX 確實也利用了「可能是此類中最大的資料集」作為實驗的對照。這使得研究人員能夠確定他們的模型相對於現有知識的表現如何,並驗證 APEX 發現的抗生素序列的獨特性和有效性。
「只有擁有高質量的資料集,人工智慧才能在生物學這樣複雜而混亂的領域取得成功。」De la Fuente 說,「我們多年前就意識到了這一點,並一直在努力建立可用於訓練我們演算法的資料集。」
De la Fuente 實驗室的博士後研究員 Fangping Wan 表示,APEX 結合使用了迴圈神經網路和注意力網路,執行兩項關鍵任務,即識別加密肽,即蛋白質內具有抗菌特性的片段。
「迴圈神經網路非常擅長處理序列,比如蛋白質,因為它們可以處理輸入獨立且有序的資料。」Wan 說,「而注意力網路可以提高網路定位可能與抗菌活性有關的蛋白質結構特定部分的能力。」
這些模型預測了 37,176 種具有廣譜抗菌活性的序列,其中 11,035 種在現存生物體中未發現。
合成與應用驗證
他們還合成了 69 種肽,並透過實驗證實了它們對細菌病原體的活性。大多數肽透過使細菌的細胞質膜去極化來殺死細菌,這與已知的抗菌肽相反,後者往往以外膜為目標。
值得注意的是,其中一些先導化合物(包括來自猛獁象的猛獁象素-2、來自直牙象的象素-2、來自古海牛的氫化達明-1、來自巨型樹懶的肌肽-2 和來自已滅絕的巨型麋鹿的巨角鹿素-1)在患有皮膚膿腫或大腿感染的小鼠中表現出抗感染活性。
這是至關重要的一步,因為它使這些候選藥物更接近潛在的臨床試驗和最終的治療用途。
此外,大多數古老的肽都具有一種新的作用機制,即透過去極化細菌的細胞膜,這種獨特的靶向方式暗示了一種傳染病控制的新模式。
總而言之,De la Fuente 實驗室在過去五年中進行的計算工作大大加快了發現新抗生素的能力。過去使用傳統方法需要多年艱苦工作的工作,現在使用 AI 只需幾個小時即可完成。
相關報導:https://phys.org/news/2024-06-ai-antibiotic-resistance.html