北鯤雲超算平臺如何為生命科學研究提供資料歸檔與儲存服務?

beikun_北鯤雲發表於2021-11-06


在人 工智慧、計算機、大資料等技術飛快演進的大背景下,生命科學如何與它們互相交叉、融合、滲透乃至賦能,實現乘法效應甚至指數級效應,已成為全球科學界新的風口趨勢。 這也是北鯤雲超算平臺 自成立以來 始終在嘗試做的事情。

 

作為生命科學的基礎學科,從全球來看,DNA測序儀每年能產生大約150億兆(PB)位元組的資料(這一資料仍在迅速增長);而1PB就是1000個TB。要想把150億兆位元組的資料燒錄到大容量DVD中,刻出來的光碟摞起來能達到2.5英里高,而這僅僅是原始資料。顯微圖片等表型資訊的實驗資料甚至會成倍增加儲存的問題。面對有數百億兆之多的資料,同時又要確保這些資料的快速共享,當然需要藉助雲端計算平臺。

 

毋庸置疑的是,如今生物學根本離不開計算機的幫助。事實上,“生物資訊學”這個全新的科學學科已悄然興起,用於分類、研究不斷增長的生物學新資訊。同樣是在雲端計算的加持之下谷歌旗下的DeepMind公司讓蛋白質結構預測取得了突破性進展,其研發的AlphaFold2,可以說是蛋白質結構預測的里程碑。蛋白質是生命的物質基礎,每個蛋白質的氨基酸鏈扭曲、摺疊、纏繞成複雜的結構。科學界採用了多種技術手段解析這種結構,都需要花很長的時間,甚至難以完成。但透過雲端計算能夠大大加速蛋白質的結構預測程式。值得一提的是,北鯤雲超算平臺已經預安裝了AlphaFold2,使用者在登陸後可以直接使用該軟體。

 

除了能夠加速科研程式之外,雲端計算的另一個優勢在於資料歸檔,這也是研究人員在跟北鯤雲超算平臺簽署伺服器租約最關心的問題。如果北鯤雲超算SaaS平臺因為某種原因關閉,或者研究人員決定換成不同的系統,北鯤雲超算SaaS平臺也會明確給出提取資料的路徑。北鯤雲超算平臺提供的服務允許將所有的東西都刻在光碟上並且把一大摞硬碟給使用者,使用者不用擔心‘嫁給’雲一輩子。 

然而對於通用的儲存來說,雲可以提供意外事故和本地災害的保護,因為雲服務一般會在多個地點複製資料。“可能其中一個資料中心被流星擊中,另一箇中心又有火山爆發,但是你還是能夠得到另一個資料備份。這就是雲平臺的優勢。

 

 

 

 

 

 


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70001891/viewspace-2840936/,如需轉載,請註明出處,否則將追究法律責任。

相關文章