聯邦學習最新醫療場景釋出,同濟大學劉琦教授團隊與微眾銀行楊強教授AI團隊合作打破藥物資料共享壁壘

新聞助手發表於2020-12-17

近日,國內AI場景應用再次取得重要成果。來自同濟大學生物資訊系的劉琦教授課題組與微眾銀行楊強教授AI團隊合作,透過聯邦學習來進行本地藥物隱私資料的保障,以及模擬多個製藥機構(使用者)之間的藥物協同開發,助力製藥機構在保障自身藥物資料隱私安全的前提下進行協同藥物發現。

該成果已發表在生物資訊學領域著名期刊《Bioinformatics》上,題為《FL-QSAR: a federated learning based QSAR prototype for collaborative drug discovery》,首次探索了應用聯邦學習進行協同藥物開發的可行性,並提出了一種基於聯邦學習的協同藥物定量構效原型系統FL-QSAR。

聯邦學習最新醫療場景釋出,同濟大學劉琦教授團隊與微眾銀行楊強教授AI團隊合作打破藥物資料共享壁壘圖:聯邦學習流程圖定量構效模型是藥物設計領域的經典模型,可用於對於藥物分子結構和分子活性之間關係的建模和預測。生命科學領域嘗試透過經典的加密計算手段來進行生物和藥物資料的共享和建模,然而隨著世界各國提出了一系列法律法規(如歐盟的GDPR,美國的CCPA)來保護資料的私密性和安全性,要求資料不能出本地或跨域,傳統資料共享方法將面臨新的法律法規的挑戰。

聯邦學習是近年提出的一種新的合法連結資料孤島進行資料共享計算的協作正規化,由谷歌和楊強教授團隊分別在to C和to B場景率先提出。相比於傳統資料加密共享方法,聯邦學習基於資料可用不可見的理念,透過聚合所有使用者的加密模型引數,在資料不出本地的情況下進行模型協同訓練,能夠更好的面對資料共享領域出現的新的問題和法律法規約束。

聯邦學習在金融等領域已獲得廣泛關注,但是在藥物研發及生物計算領域尚未有所應用。製藥領域普遍對於資料不出本地進行共享有著強烈需求,迫切需要探索聯邦學習在該領域的應用。本次微眾銀行AI團隊和同濟大學的合作專案,是聯邦學習在藥物研發領域首次應用探索。

專案首次在藥物小分子領域探索使用聯邦學習正規化進行藥物協同開發的可行性,結合微眾銀行的聯邦學習開源平臺FATE,開發了基於聯邦學習的協作藥物發現平臺FL-QSAR。研究團隊透過對於包含了15個藥靶的QSAR 基準資料來構建深度學習模型,進行QSAR建模以及多製藥機構(多使用者)環境下的協同藥物開發模擬,模擬結果證明:(1)多使用者透過FL-QSAR進行協同QSAR建模,將顯著優於單使用者僅使用其私有資料進行QSAR建模,(2)透過特定的模型最佳化,FL-QSAR可以在保護藥物小分子結構隱私的前提條件下,獲得與直接整合多使用者小分子資料進行QSAR建模相同或者類似的模型預測效果。

同濟大學與微眾銀行AI團隊在這項產學研協同中,嘗試去解決傳統藥物領域的上述“頑疾”——即不同的製藥機構之間可以透過資料共享來提高QSAR建模預測的準確率,然而該領域的智慧財產權和相關的經濟利益不利於製藥機構之間進行資料的直接共享和合作。透過在藥物小分子領域探索使用聯邦學習正規化進行藥物協同開發的可行性,結合微眾銀行的聯邦學習開源平臺FATE, FL-QSAR可以在保護藥物小分子結構隱私的前提條件下,獲得與直接整合多使用者小分子資料進行QSAR建模相同或者類似的模型預測效果。

這是一種有效的藥物協同發現的解決方案,打破了傳統QSAR建模時不同製藥機構之間的資料無法直接共享的壁壘,有助於在隱私保護的前提條件下進行協同藥物發現,並適合於推廣和應用到生物醫學隱私計算的其他相關領域。該研究成果得到國家重大研究與發展計劃、國家自然科學基金專案、上海市自然科學基金專案、上海市人工智慧標準專項專案等基金的資助。

從全球來看,AI產業化進入深水區,近日谷歌AI團隊DeepMind所研究的AlphaFold 演算法在生物學領域也取得了重要突破,在此演算法下,可透過蛋白質的氨基酸序列高精度地確定其3D結構。AI與生物醫學的密切結合將推進人類健康事業的發展與探索進入新的階段,多位業界專家紛紛表態,稱“AI將改變生物學”,而聯邦學習等新技術的加入將從隱私保護等倫理道德層面為探索之路保駕護航。


論文詳情:https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btaa1006/6026958

相關文章