簡介:雲上高效能運算EHPC助力聖庭醫療提升基因檢測效率,為患者提供更多精準化醫療方案。
為什麼別人胡吃海塞都依然瘦成竹竿,我喝水都會胖?
為什麼我這麼不幸,疾病會找上我?早知道就不亂喝酒。
為什麼是同一種病,別人吃這個藥有用,我吃卻沒用?
從日常的健康管理、疾病預防,甚到罹患重症時的最有效的醫療方案,都跟基因有關。在新冠疫情的溯源與藥物研發中,病毒全基因組的測序,同樣發揮著重要作用。
然而,人類對基因的探索是一個漫長而艱辛的征程。號稱生命科學領域“登月計劃”的“人類基因組計劃”於1990年啟動,計劃測定組成人類染色體的30億組鹼基對。經過六國2000多名科學家努力,耗資30億美元,終於在2003繪製完成人類基因組圖譜。
隨著技術的發展,基因測序的費用正在急速變低。隨著二代、三代高通量測序技術的出現,人全基因組測序的成本在過去十多年間從一千萬美元逐漸降低到一千美元。
這讓很多生命科學領域的學者看到基因測序技術應用到臨床的可能,並希望以一己所學,為飽受疾病折磨的人帶來新希望。
谷紅倉博士也是懷揣著如斯願景的學者。
01 從出世到入世,以基因測序抗衡癌症
回到2013年,谷紅倉博士正在哈佛大學-麻省理工博德研究院(The Broad Institute of Harvard and MIT)供職。博德研究院是全球生物遺傳學最頂尖團隊,由基因組學泰斗Eric S. Lander創立。Lander博士是前文提及“登月計劃”的發起人之一和主要執行人。
身處如此團隊,每年不乏在《Nature》和《Cell》等頂級期刊發表論文的機會,已是無數學者夢寐以求。唯一美中不足的是,基礎科學主要專注理論探索,鮮少臨床論證,谷博士也希望能為人類健康事業發展做點什麼,思忖著轉向臨床研究。
谷紅倉博士
恰逢次年,國內浙江天宇藥業股份有限公司(股票程式碼:300702. SZ.)的董事長屠勇軍,輾轉找到谷紅倉博士,邀請谷博士加入並領導其新投資成立的基因測序實驗公司--浙江聖庭生物科技有限公司。彼時,中國國內基因測序行業也是風起雲湧,格局初成。華大基因(BGI)、貝瑞和康(BERRYGENOMICS)、安諾優達(ANNOROAD)等企業在無創產前基因檢測領域跑馬圈地。
面對這個選擇,谷紅倉答應在聖庭擔任兩年顧問,最終在屠勇軍董事長的“三顧茅廬”之後,決定回國,以聖庭創始人兼首席科學家的身份,領導這家實驗室。同時,他為自己,也為聖庭做了一個重大的決定:轉型。
成立之初的聖庭生物主要服務於基礎科研,為科研院所提供測序服務和技術指導。轉型之後,聖庭將會面向腫瘤的病人,為其進行精準的基因測序和專業的結果解讀,為癌症患者提供個性化的治療。改善患者的生活質量和延長他們的生命週期,這更符合谷博士的初心,也更符合他對行業的判斷。
你也許會疑惑,基因測序對病人的意義究竟有多重要?
即便是罹患同一種癌症,不同患者可能存在著不同的驅動基因突變,突變情況不同,會導致有的藥對某位患者有效,對其他患者卻毫無作用。電影《我是藥神》中的靶向藥便是典型例子。怎麼找到屬於自己的特效藥?不通過基因測序,需要化療的病人只能不斷地嘗試不同的藥物。蘋果創始人賈伯斯花費10萬美元進行基因測序,指導個性化治療,換來10年壽命。
聖庭想要把這種技術普惠到更多的患者。
02 轉型後高速發展,面臨成長的壓力
2017年,聖庭生物改成“聖庭醫療”,開始轉型。
聖庭醫療杭州實驗室
針對臨床的基因測序,美國醫學遺傳專家委員會(American Board of Medical Genetics and Genomics, ABMGG)開設了實驗室遺傳學和基因組學( Laboratory Genetics and Genomics)專案,規範了基因測序從樣本的獲取、處理、檢測、分析到報告出具等全流程,以培養合格的臨床醫學遺傳實驗室主任。該學科全美每年僅錄取約50人。“國內的遺傳學還是空白,直到2021年才開始設立類似學科”。
為了讓聖庭的基因測序做到國際領先水平,谷博士在美國花費兩年的時間,全脫產參加了這個專案學習,同時邊學邊培訓聖庭的同事,最終領導聖庭獲得了美國病理學家學會(College of American Pathologists, CAP)資格認證,意味著出具的檢驗報告將具備全球可比性和互認性,標誌著實驗室能力達到國際標準。
此後的聖庭醫療也迎來了快速發展時期。業務由早期的腫瘤基因檢測,發展到基於奈米孔測序技術的病原檢測和精神類疾病及慢性病基因檢查。團隊從原來的20多人發展到了200多人,逐漸在北京、杭州、台州、長沙、廣州開設了醫學檢驗中心和實驗室;接觸到的樣本量和接收的業務量也在快速增長。
大量患者深受病魔折磨已久,終於通過基因測序技術,查明瞭致病的基因突變或病原,找到了對症的藥物,病情大大得到了緩解。比如,聖庭癌友李明(化名)是一位肺癌晚期患者,併發骨轉移、淋巴轉移,醫生曾預估生存期不到半年。從吃上第一粒靶向藥開始,如今已經走過了四個年頭,正在突破五年。而這期間,李明在聖庭歷經了四次基因檢測,一次又一次地找到了治療的方法,獲得了新生。
在正確的戰略與發展策略下,聖庭也幫助到了越來越多的病人。然而,飛速發展的聖庭也遇到了成長的煩惱:基礎設施的發展跟不上業務的發展了。
高通量基因測序經歷樣本製備、上機測序後,將產生龐大的基因序列資料,並涉及海量的資料儲存、計算與傳輸,這對底層基礎設施有著極高的要求。原來的IDC機房,已經跟不上快速發展的聖庭。
聖庭需要再次求變。
(點選圖片可放大檢視)
03 雲上高效能運算EHPC提升測序效率
基因測序所產生的海量資料,基本是不離開雲的。從前,谷紅倉所在的博德研究院,早在10年前每天所產生的資料就有20T,在全美機構中排名第二,很早就選擇了雲端計算。而聖庭最早因為資料較少,高校對時效性的要求不強,也按行業慣性選擇了自建網際網路資料中心(Internet Data Center,IDC)機房。
自建IDC機房對生信科學家們來說自然並非易事,只能硬著頭皮“自學成才”。
聖庭IT負責人黃雲的經歷彷彿是行業縮影,為了建設公司的IDC機房,“找哪裝潢修公司,電力系統要多少動力,多少瓦、電線的粗細、UPS要配多少,隔音怎麼弄,叢集架構、儲存技術用什麼儲存技術,叢集排程軟體用什麼……從裝修、部署、實施到運維、使用,都是自學的。行業都是這樣經歷過來的,崗位沒有那麼細分”。
黃雲透露,生命科學行業近幾年發展較快,研究員都是身兼多職,沒有專門的運維人員。這種方式不僅有著潛在的資料安全隱患,一旦機房發生火災、水災或磁碟損壞等即意味著資料的丟失,隨著業務發展,運維成本的增加也難以為繼。
聖庭近幾年的業務量增長很快,隨著資料量的增加,所需的伺服器日益增長,運維成本也在上升。谷紅倉回憶:“負責IT團隊的同學,每週都要過去台州進行維護。每個月的電費高達上萬,2021年還出現了電荒。” 這些他都看在眼裡。
更重要的是,計算效率會影響患者的體驗。實驗室給癌症患者提供的檢測報告,一般承諾7天出報告,樣本的運輸用去不少時間,本就時間緊迫。隨著業務量增加,IDC機房的算力難以滿足要求,大量的測序檔案需要排隊,時間給測序人員帶來大量的壓力,也會影響患者的體驗。
聖庭的腫瘤檢測業務,實驗室在臺州,樣本需要台州檢測,分析人員則在杭州。基因資料資料計算完畢後,需要從台州傳到杭州分析,後來隨著北京、廣州等多地實驗室出現,資料傳輸效率和安全風險就愈發攀升。
聖庭創始團隊的一位親友,剛好是雲端計算從業者,聽說了聖庭所面臨的運維、計算、儲存、傳輸等一系列的煩惱之後,發現雲端計算可以完美解決,便推薦他們使用阿里雲。雙方可說相逢恨晚,聖庭上雲已是勢在必行。
2021年,聖庭醫療決定將業務全面將業務遷上阿里雲。
上雲後,聖庭通過阿里雲彈性高效能運算EHPC進行基因比對,計算的效率得到了大幅提升。黃雲還記得,最近最多一天送過來5批資料,如果沒有上阿里雲,利用自建機房可能就需要分析好幾天,最後一批資料光是排隊就要三天。
但上雲了之後,就不需要擔心這個問題了,雲的彈性讓聖庭可以直接根據資料量隨時“彈出”算力,並且隨時可基於HPC排程系統建立出不同佇列的規格算力,並作資源隔離,以靈活應對不同業務場景的資源需求及併發。原來分析一個批次的樣本需要10小時,上雲之後只需要3小時,計算效率提升70%,能夠快速給患者出具報告。
雲免運維的特性更是大大降低了聖庭的運維壓力,專注核心業務。阿里雲的高效能資料中心有專業人員運維,消除了聖庭運維成本高企的苦惱;同時,阿里雲上的資料一直採用多副本災備的機制,可靠性高達10個9,資料安全得以保障;阿里雲遍佈全國各地的資料中心也能保證資料的傳輸效率,方便聖庭內部的高效協作。
如今,輕裝上陣的聖庭醫療也在探索更多的領域,為患者提供更多精準化醫療的解決方案。
聖庭基於專利技術的三類IVD產品"人基因組甲基化檢測試劑盒"已經進入臨床試驗階段。在感染領域,基於二代測序和三代奈米孔測序雙平臺開發了“思可愈”系列感染精準診斷產品,併成功推出了國內首個基於高通量測序技術的專門針對分枝桿菌鑑定和耐藥基因檢測的產品。
展望未來,希望在雲端計算與生命科學產業的共同發展下,人類能不斷“解密”基因,預防、治療甚至消滅疾病。
點選這裡,檢視更多生命科學領域的行業實踐。
版權宣告:本文內容由阿里雲實名註冊使用者自發貢獻,版權歸原作者所有,阿里雲開發者社群不擁有其著作權,亦不承擔相應法律責任。具體規則請檢視《阿里雲開發者社群使用者服務協議》和《阿里雲開發者社群智慧財產權保護指引》。如果您發現本社群中有涉嫌抄襲的內容,填寫侵權投訴表單進行舉報,一經查實,本社群將立刻刪除涉嫌侵權內容。