作為中國工程生物學、合成生物學研發的中堅力量,由中國科學院和天津市人民政府共建的中國科學院天津工業生物技術研究所(簡稱:天津工業生物研究所)已經成為工業生物技術國家級創新科技平臺。
得益於科研團隊孜孜不倦的技術攻關,天津工業生物研究所牽頭組織承擔了多項合成生物學、綠色生物製造等重點研發計劃任務。天津工業生物研究所擁有目前國內合成生物學、生物製造領域比較少見地,從基礎研究端到產品端再到產業轉化運營端完整的全產業鏈生態體系。
2019年,天津工業生物研究所成立了生物設計中心平臺實驗室,並圍繞生物計算設計,開始與亞馬遜雲科技共同探索生物技術和資訊科技相結合(BT+IT)技術體系,以進一步推動合成生物學發展,以期能夠為在健康、能源、農業和環境等領域的重大突破提供技術支撐。
而近期,這一合作已經將升級至2.0階段。雙方在AI、大模型甚至量子計算等一系列前沿技術合作已箭在弦上。
構建BT+IT技術體系
天津工業生物研究所與亞馬遜雲科技的合作,始於2019年的上雲浪潮。當時天津工業生物研究所負責IT技術的團隊規模不大,開發人員數量不多。他們既要兼顧多個應用場景,開發不同的應用需求,同時需要開發好幾個任務。
現實的需求讓天津工業生物研究所開始嘗試從基於伺服器端的開發模式,轉向於雲原生的開發模式,藉助雲端計算,很好的提升了科研業務的效率。從2019年開始在雲上已經部署了超過20個雲端應用。
天津工業生物研究所打通了一系列的不同的雲上應用開發方式,包括純分析類的、面向使用者的工具/網站平臺開發。幾年來已經圍繞著工業生物設計裡面的不同子領域做了相當多的工作,比如說序列設計、圖譜、各種分析平臺開發、資料庫開發等。
1.0技術合作三階段層層遞進
亞馬遜雲科技與天津工業生物研究所經過了四年多的合作,從最初的數字中心到現在的所有IT架構、開發理念、開發模式都以雲原生的方式實現,合作分為三個階段:
最初在2020年及之前,更多的是在學習雲端計算的一些技術,包括初步嘗試在雲上利用一些新的工具做構建。憑藉天津工業生物研究所的行業經驗和亞馬遜雲科技的提供的很好的雲端計算解決方案和思路,研發人員理解了雲端計算在解決具體場景需求方面的能力。
第二階段,2021年進入快速發展期,天津工業生物研究所陸續有10多個軟體應用實現了雲上部署,並嘗試構建雲原生現代化應用,探索出了適合生物設計中心業務模式的最佳實踐。
第三階段,從2022年到現在,天津工業生物研究所使用託管服務和創新服務進行雲原生創新,加大對雲端計算優勢的利用,如按需交付、快速擴充套件、彈性等,大大提升了開發效率、業務敏捷性、可擴充套件性和可用性,同時實現成本節約。
生物計算設計成果頻出
天津工業生物研究所與亞馬遜雲科技攜手,透過突破傳統開發模式提升科研效率,在核心資料庫和專業應用工具設計兩大研發方向上實現技術突破,有效推動了合成生物學發展。
天津工業生物所生物設計中心團隊聯合亞馬遜雲科技團隊在計算生物學國際期刊《Nucleic Acids Research》(《核酸研究》)上發表文章,釋出了首個基於圖資料庫Amazon Neptune的大腸桿菌調控代謝關係知識圖譜ERMer,首次提供了全域性的代謝調控圖譜,並透過視覺化框架實現了豐富的搜尋功能,如多步查詢、最短路徑查詢等。ERMer採用專門為高度關聯的複雜資料集的高效儲存和查詢設計圖資料庫架構,這打破了傳統的低效資料檢索方式,有效增強使用者和圖譜的人機互動,大大降低了使用門檻。
為充分發揮知識圖譜的價值,生物設計中心團隊還進一步採用基於圖神經網路技術進行推理,成功實現了轉錄因子預測和轉錄因子靶點預測等功能,這將有助於挖掘潛在的關鍵調控因子和調控靶點,構建新的調控代謝網路,能夠為研究人員提供新的思路和方向。
另外,天津工業生物所生物設計中心團隊開發得到了第一個能夠在所有操作型別、任何基因組位點和跨物種上進行精確、自動化和高通量編輯序列設計的雲平臺AutoESD。AutoESD的開發採用了基於雲端的無伺服器架構,確保了高可靠性、穩健性和可擴充套件性,能夠在幾分鐘內並行處理包含上千個編輯序列設計目標的數百個設計任務。
開發人員利用Amazon Lambda無服務計算將不同的引物設計、同源臂設計等編輯序列設計模組封裝打包,滿足了具體功能的模組化開發要求,並方便地對功能模組進行管理和共享;利用Amazon DynamoDB提供毫秒級的動態資源響應效能,並自動擴充套件所需資源以應對增加的業務需求;利用Amazon Step Functions實現視覺化的工作流管理,實現了編輯序列設計工作流的串聯,從而實現應用的快速構建和更新,同時快速查詢處理異常任務。這些Serverless服務幫助天津工業生物所團隊進一步簡化運維,使得開發人員可以專注於業務程式碼和創新,與傳統開發方式相比,開發時間縮短了75%,總體擁有成本降低50%。
戰略合作升級到2.0 AI、大模型等是未來重點
中國科學院天津工業生物技術研究所副所長王欽宏介紹稱,研究所正式成立十年來,產生了一系列的成果,尤其是最近幾年隨著積累的增加,成果產生的速度還在逐漸加快。從整個科技創新來說,研究所的創新首先要解決底層技術的創新,圍繞著工業生物創制的體系的底層技術,做了很好的佈局,也取得了不錯的成績。
王欽宏強調要藉助亞馬遜雲科技強大的雲端計算能力、強大的資料處理能力、強大的計算平臺,為天津工業生物研究所認識生命、設計生命以及合成生命來提供一個更好的支撐。
中國科學院天津工業生物技術研究所生物設計中心主任馬紅武認為,如同當下AI已經升級到2.0階段,與亞馬遜雲科技的合作也準備進入到2.0模式。要把AI大模型、圖資料庫、知識圖譜和工業生物大資料結合在一起,雙方合作進一步深化並提升到新的高度。
中國科學院天津工業生物技術研究所生物設計中心副主任廖小平表示,天津工業生物研究所生物設計中心團隊從去年開始佈局做機器學習和推理的任務,今年上半年開始做大語言模型,希望用另外一種方式來推動研發方式的轉變,從而撬動研發的新正規化。此外,也期望透過亞馬遜雲科技的全球科研領域輻射能力,提升天津工業生物研究所生物計算設計方面的國際影響力,為世界各國的合成生物學科研工作者提供優質服務。
亞馬遜雲科技中國區商用與公共市場事業部總經理李曉芒表示:“亞馬遜雲科技為全球數千家生命科學領域客戶提供雲服務和行業解決方案,助力從實驗室到真實世界,全面加速生命科學數字化創新。我們很高興能夠與天津工業生物所一道,透過雲技術和深厚的行業實踐推動合成生物學領域的技術進步,開拓生物製造產業的數字化創新路徑。”