浪潮分散式儲存助力江蘇省血液研究所搭建血液病檢測平臺

全球TMT發表於2022-05-22

北京 2022年5月20日 /美通社/ -- 近年來,基因測序等分子生物學檢查技術已經在血液病基因分析、基因診斷、白血病分型、指導治療、判斷預後等方面廣泛應用,血液學成為現代生命科學技術發展最為活躍的領域之一。透過加強技術創新,中國血液學研究在基礎理論研究以及臨床轉化和實踐方面已然躋身世界前列。

基因測序作為一種新型基因檢測技術,在生命科學研究中扮演著十分重要的角色。隨著測序技術的飛速發展,人類發現的基因序列數目以指數級增長,對於如此數量龐大的基因進行同源性搜尋、比對、遺傳發育分析等操作,往往伴隨著巨大的資料處理量和平行計算量。江蘇省血液研究所(以下簡稱血研所)採用浪潮分散式儲存AS13000搭建了血液病檢測平臺,支撐了前端的基因檢測業務,並依靠方案的高可靠、高可用、易擴容等特點,保障血研所業務高效執行並滿足後續業務持續增長需求。

血研所主要研究方向為血栓與止血、惡性血液病和造血幹細胞移植,本次搭建的科研平臺主攻血液病的基因檢測場景。基因測序是一種新型基因檢測技術,能夠從血液或唾液中分析測定基因全序列,預測罹患多種疾病的可能性,過程中將會產生大量的資料,對儲存系統帶來了較大規模的挑戰。血研所也是國內第一個血栓與止血研究室,需要對大量樣品進行資料的採集、分析和計算,且對資料的持續讀取效能、安全性要求很高,隨著血液檢測的技術創新與精確度的提升,預計未來每年的資料增長量在100TB左右。

浪潮分散式儲存支撐血液病檢測平臺

結合檢測平臺資料特點及需求,血研所採用浪潮分散式儲存AS13000系列,在基因測序過程中滿足了海量空間、高IO併發效能、業務連續性等需求,滿足了血研所臨床與多課題組同時線上使用的業務需求。

面對基因測序業務增長帶來的效能和容量需求,浪潮分散式儲存AS13000透過檔案方面的智慧條帶化(Stripe)技術,實現單個檔案跨節點分佈,提高資料併發訪問效能。若後續資料規模不斷增長,業務負載壓力變大,AS13000支援透過整合SSD資源作為高速資料緩衝區,可進一步提升系統IO效能。平臺一期建設配置超300TB可用空間,滿足血研所未來兩年的資料增長需求,隨著血研所科研資料量的增加,還可透過節點線上橫向擴充套件的模式,實現系統容量和效能呈線性增長,總容量可達EB級,滿足基因測序資料持續增長需求。

整個基因測序業務需要在高負載下7*24持續執行,一旦出現業務中斷,那麼整個基因測序工程就要中斷,甚至於整個的基因測序要重新進行。因此,連續性是基因測序的根本生產力保證,基因測序業務對儲存系統連續執行能力有極高的要求。浪潮分散式儲存在設計方面能夠保證所有的關鍵系統服務都分佈在多個硬體上,避免系統資源單點故障,消除系統瓶頸;糾刪碼策略能夠在保障最高94%空間利用率的同時,允許叢集內同時故障2個節點而資料不丟失,保障基因測序的業務連續執行。

江蘇省血液研究所血液病生物樣本庫經過多年發展,建成包括生物樣本庫、臨床資料庫和質量控制實驗室三個部門的血液病生物資源庫,涵蓋樣本及資訊收集、儲存、利用全環節的生物資源管理體系。截 目前,共收集了103910 例各類血液疾病患者的樣本共計578331 份,樣本型別涵蓋凍存細胞、骨髓組織、骨髓細胞玻片、血漿、血清、DNA 和RNA 等,出庫樣本量達59522 份;臨床資料庫建立造血幹細胞移植患者檔案3000 餘例。血液病生物資源庫是目前國內規模較大的血液疾病生物資源庫之一,建立了國內最大的造血幹細胞移植、骨髓增生異常綜合徵和急性混合細胞白血病的生物樣本研究佇列,為血液病基礎和臨床研究提供高質量的樣本和資料支援。江蘇省血液研究所將繼續堅持科研與臨床相結合的理念,努力建設成為具有國際一流水平的血液病臨床診療和轉化研究中心,為血液學領域做出新的貢獻。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70004007/viewspace-2896087/,如需轉載,請註明出處,否則將追究法律責任。

相關文章