阿里雲MaxCompute攜手華大基因打造精準醫療應用雲平臺

床上不敗發表於2017-11-29

點選有驚喜


摘要:華大基因股份公司總監金鑫介紹了華大基因,並淺談了與阿里雲的情緣,包括Maxcompute等方面應用案例。一起來看下吧。

 

關於華大基因

華大基因是中國最領先的基因科技公司,華大基因為消除人類病痛、經濟危機、國家災難、瀕危動物保護、縮小貧富差距等方面提供分子遺傳層面的技術支援。目前,世界上只有兩個國家的三個公司可以生產、量產臨床級別的基因測序儀,華大基因是中國的唯一一家。我們在基因的產權研發方面從1999年開始做了很多的工作。在2014年,我們與阿里雲有了初步的接觸,在2015年上線了我國第一個基因雲端計算平臺。

 

挑戰

我們與阿里雲合作是因為我們看到基因技術從過去的只在實驗室中逐漸進入到廣大群眾的生活場景當中,不管是在醫學健康方面、生殖健康方面、腫瘤防治方面、病原感染方面還是農業育種,以及與我們每個人息息相關的健康管理,基因技術已經取得越來越多的應用場景,在國產基因測序儀的助力之下,基因資料產生的體量也越來越龐大,遠遠的超出了原有的計算能力所能支援的範圍。

 

解決方案及架構

針對上述情況,華大基因業務逐步遷移到阿里雲端計算平臺之上。 
新的日誌分析架構如頁面下方架構圖所示。

13e0f7fba7a8f0225f7298fddbd3739932ade45d


方案涉及的阿里雲數加平臺元件有:
• 大資料計算服務(MaxCompute),是一項大資料計算服務,它能提供快速、完全託管的PB級資料倉儲解決方案,使您可以經濟並高效的分 析處理海量資料。
• 批量計算(BatchCompute),一種適用於大規模並行批處理作業的分散式雲服務。BatchCompute可支援海量作業併發規模,系統自動完成資源管理,作業排程和資料載入,並按實際使用量計費。BatchCompute廣泛應用於電影動畫渲染、生物資料分析、多媒體轉碼、金融保險分析、科學計算等領域。
• 物件儲存(OSS),海量、安全、低成本、高可靠的雲端儲存服務,提供99.99999999%的資料可靠性。使用RESTful API 可以在網際網路任何位置儲存和訪問,容量和處理能力彈性擴充套件,多種儲存型別供選擇全面優化儲存成本。


正是這樣的背景之下,在非常強勁的需求驅動下,我們與阿里雲開始了合作,使用了阿里雲端計算儲存的多款產品,尤其包括批量計算、Maxcompute等一些異構計算方式,使我們原先需要幾周甚至更長時間才能完成的計算任務在一兩天內得以解決。在我們現在進行的百萬人基因組專案中,阿里雲的Maxcompute技術幫助我們大大加速了對於人群結構的分析速度的進展。

客戶收益

每個人的基因資料為100G,傳統計算方式處理需要三到五天,使用Maxcompute使得整個分析可以在一小時內完成,大大加速了資料吞吐速度和交付速度。另外,在對百萬人的基因資料進行遺傳結構分析時,我們需要把每一個人與剩餘的所有人進行遺傳距離計算,這個計算量是巨大的,計算複雜度已經遠遠超出了傳統計算條件下硬體裝置所能承受的能力範圍,通過使用Maxcompute,我們已經在這方面取得了技術突破,其中,我們在幾小時內就可以把一個人與十萬人中所有遺傳距離進行計算,這樣的例子我們還在不斷的開發中,相信Maxcompute也會給我們帶來更多的驚喜。

 

在儲存方面,我們也使用了阿里的產品,每年我們會產生非常多的基因資料,明年我們計劃對十萬人進行基因組的基因測序和分析,我們將與阿里雲端計算平臺一起在2018年用國產測序儀完成計算、分析和交付。



MaxCompute招聘資訊:DT時代,與堅持夢想者同行!


阿里巴巴大資料-玩家社群 https://yq.aliyun.com/teams/6/

---阿里大資料博文,問答,社群,實踐,有朋自遠方來,不亦說乎……

bba01b493e1c5d904e882b1c380673c6ebe49a98


點選有驚喜


相關文章