《Nature Commuciations》發表第四正規化論文,AI為攻破生物化學難題提供新思路

第四范式發表於2018-12-11

近日,國際頂級學術期刊《Nature Communications》(IF 12.353)發表了第四正規化科學家王嘉磊題為《Discovering de novo peptide substrates for enzymes using machine learning》的論文。該論文提出了一種通過聯合人工智慧和生物化學手段來快速優化具有特定生化機能的肽鏈的通用方法,該方法可大幅提高肽鏈的發現速度。

《Nature Commuciations》發表第四正規化論文,AI為攻破生物化學難題提供新思路

肽由於其無與倫比的活性和多樣性,對人類近代醫學發展起到了關鍵作用,因此發現和合成具有特殊效能的肽一直是生物化學領域的重點研究方向,而時下火熱的人工智慧技術則為該研究方向提供了新的“攻堅”武器。

《Nature Commuciations》發表第四正規化論文,AI為攻破生物化學難題提供新思路

該論文中提及通過採用迭代式的機器學習來加快肽鏈發現的過程:一個機器學習模型讀入歷史實驗資料並能對任意一種新的肽鏈結構作出預測;基於貝葉斯優化的搜尋演算法將會發現最有潛力的肽鏈以供合成和實驗驗證;新的試驗結果又被用來訓練更新機器學習模型;該過程不斷重複直到發現目標為止。

《Nature Commuciations》發表第四正規化論文,AI為攻破生物化學難題提供新思路

《Nature Commuciations》發表第四正規化論文,AI為攻破生物化學難題提供新思路

相比傳統的基於變異進化的搜尋方案,機器學習模型具有更強的導向性,和貝葉斯優化這種高效的搜尋策略聯合,整體發現速度比傳統進化方案有數量級的提升。基於此方案設計的系統來發現可用作蛋白質標記的正交肽受體,發現命中率高達30%,遠高於變異進化方案的3%和隨機搜尋的0.001%。此前有報導稱,哈佛醫學院曾花費一年多的時間找到一種肽鏈。而基於此方案設計的系統則在一年多的時間內發現了三百多種肽鏈,大幅提高肽鏈的發現速度。基於論文闡述方案的通用性,該系統可被廣泛應用到生物化學的肽優化問題中。

《Nature Communications》是國際頂級學術期刊《Nature》發行的子刊,其目的在於釋出頗具綜合性並代表某一領域重大進展的研究論文。作為國際“綜合性期刊”領域的頂級雜誌,該刊物內容涉及自然科學所有領域,發表的論文極具科研及應用價值,為各領域的創新發展提供了重要的參考意義。在最新發布的2017年科學期刊引用報告(JCR, Journal Citation Reports)中,《Nature Communications》位列全球多學科綜合性期刊的第3位,僅次於《Nature》與《Science》。

論文連結:https://www.nature.com/articles/s41467-018-07717-6

相關文章