摘要:日前,由華為與武漢伯生科技基於昇騰AI合作研發的“思符(SiFold)蛋白質結構預測平臺”正式推出,併成功應用於國藥集團動物保健股份有限公司的豬圓環病毒疫苗研發中。
本文分享自華為雲社群《昇騰AI新技能,還能預防豬生病?》,作者:昇騰CANN。
日前,由華為與武漢伯生科技基於昇騰AI合作研發的“思符(SiFold)蛋白質結構預測平臺”正式推出,併成功應用於國藥集團動物保健股份有限公司(簡稱“國藥動保”)的豬圓環病毒疫苗研發中。該平臺以“低成本、低耗時、高精度”的AI預測能力助力動物疫苗研發降本增效,相較於傳統冷凍電鏡方式,其結構研究成本下降100倍,結構分析效率平均提升超10倍!
國藥集團動物保健股份有限公司(簡稱“國藥動保”)是專業從事動物保健產品研發、生產和銷售的國家高新技術企業,是國內少數幾家具備新產品原創能力的動物保健企業。其中,豬圓環病毒滅活疫苗等市場份額位居行業前列。
“豬圓環病毒類疫苗是我們的拳頭產品,疫苗的上市速度、有效性及普惠的價格得到了市場的認可,市場份額位居行業前列。”國藥動保營銷中心總經理介紹到。
在新疫苗研發工作中,蛋白質結構解析被視作先決條件。傳統解析蛋白質結構的方法主要有三種:即核磁共振、X射線衍射學、冷凍電鏡三維重構。但這三種方法,往往依賴大量試錯和昂貴的裝置,不僅對實驗人員的技能、裝置精準度要求極高,而且檢測時間也需要耗費數月甚至數年。其高額的投入制約了新型疫苗的研發速度和結構疫苗學的發展。
近年來,人工智慧技術不斷深入科學領域,極大提高了人們對自然現象進行建模和解析的能力。自2020年起,AI技術逐步被應用於蛋白質三維結構解析,其分析精度達到了結構生物學實驗的測量精度。
“傳統的冷凍電鏡方式,我們獲得蛋白質結構主要需要經過生物制樣、樣品冷凍、電鏡拍攝、資料分析幾個關鍵環節,進行一次完整的流程,至少需要耗費十多天,並且還是每個環節都順利進行的情況;此外,一個疫苗環節的研發過程中,需要反覆多次這樣的環節。對比AI技術的引入後,蛋白質的結構可透過AI技術進行解析,關鍵環節壓縮到基因測序、蛋白質預測兩個環節。我們在動物疫苗的研製中引入AI技術,希望使用業界一流的AI平臺,高效的進行疫苗的研發。” 國藥動保研發中心主任表示。
自2022年下半年開始,國藥動保就陸續與相關的供應商進行了接觸與交流,希望能夠找到一個既滿足企業當前的需求、同時又具有良好經濟性的解決方案。透過多方瞭解和比較,“思符(SiFold)蛋白質結構預測平臺”(簡稱“思符”)進入國藥動保選擇的範圍。
“思符”是華為與武漢伯生科技基於昇騰AI聯合研發,推出的可應用於生物醫藥研發的AI蛋白質結構預測平臺。該平臺依託於昇騰AI,實現了一鍵式蛋白質結構預測功能,在支援超長序列結構預測的同時,提供多序列結構預測、AI預測功能合作定製、進化的AI預測體系等服務。在武漢人工智慧計算中心、昇騰AI異構計算架構CANN的支援下,思符已成功實現3800+蛋白質氨基酸長度的預測。而自然界已知的蛋白質氨基酸長度基本不超過3000,因此可滿足絕大多數場景需求。以典型長度(900蛋白質氨基酸長度)為例,預測精度與AlphaFold2模型持平,預測效率相較業界同類方案提升兩倍多。
經過綜合考量,國藥動保最終選擇思符平臺進行新一代豬圓環病毒疫苗的研發。在對豬圓環病毒蛋白質結構的解析中,思符依託武漢人工計算中心獲取澎湃算力,大幅提升分析的能力和效率:
- 位於中間層的昇騰AI異構計算架構CANN,為模型推理提供了加速引擎,在運算元融合方面實現網路中計算單元的最佳化整合;
- 在記憶體最佳化方面完成模型特徵圖的有效記憶體排布;
- 在混合精度計算方面實現不同精度的計算分配。
多種技術創新充分釋放硬體算力,不斷最佳化AI模型效能,極大提升了AI蛋白質結構預測模型的效率。
(基於昇騰平臺的蛋白質結構預測效果)
(金色為真值,粉色為預測效果)
抗原結構最佳化環節實現了降本增效,疫苗研究步伐得以加快。在降低成本方面,此前蛋白質取樣費用至少需要1.5萬元,累計費用超過數十萬,但應用該平臺後,預測費用可以下降100倍以上。在效率提升方面,從蛋白表達、蛋白純化等步驟到使用冷凍電鏡解析蛋白質結構,至少需要13天,但使用AI預測蛋白質結構,則可以壓縮到1天以內,結構分析效率平均提升超10倍。
“對於使用AI技術進行預測的效果是有預期的,但是思符平臺給我們帶來的是驚喜,不僅在時間上顯著的縮短了蛋白質結構預測的時間,並且在準確性方面也超出了我們的預期,難得的是思符平臺的易用性對於我們疫苗研發人員非常友好,半天學習時間後就可以熟練的運用。”對於使用思符後的結果國藥動保基礎研究部經理表達了欣喜。
基於思符在豬圓環病毒疫苗抗原結構最佳化環節中的出色表現,國藥動保下一步將在圓環類疫苗和其他病毒樣顆粒疫苗的研發中進行推廣使用。不僅如此,雙方透過深入的交流,希望依託現有的蛋白質結構預測AI技術平臺,在諸如抗原表位及其強度預測、抗體從頭設計及親和力成熟等應用領域作出探索研究,加速動物保護疫苗研發的數智程式。