杉巖PACS影像系統分散式儲存架構

杉巖資料發表於2019-12-10

深圳某三甲醫院建立於1999年,是深圳市政府投資建成的集醫療、教學、科研和預防為一體的現代化三級綜合性醫院。2017年透過三級甲等醫院複審。2018年,醫院年門急診總量約292萬人次,年出院病人近7.4萬人次,年手術量4.9萬臺次。 該院在深圳有較高的知名度和認可度。

行業挑戰

隨著該醫院門診量的爆發式增長,放射科等科室新增了大量影像採集裝置,PACS儲存了大量的非結構化資料,原有的儲存系統面臨 如下挑戰

l    訪問效能不足

大批影像採集裝置產生的海量影像圖片需要經過PACS的併發處理與儲存,會導致現有儲存面臨較大的效能壓力,並影響臨床科醫生調閱影像速度。

l    資料增長快,資料量大

影像檔案每月新增數量接近1千萬,每年增長量達到上億,儲存空間高達PB級,且檔案儲存時間要求不低於15年,傳統儲存無法滿足需求。

l    資料無分級和歸檔

此前PACS系統設定的歸檔儲存裝置品牌種類多,無統一的資料生命週期管理,需要儲存系統根據效能和容量的不同進行合理分級和歸檔,滿足法規遵從要求。

l    影像檔案無法實時調閱

此前影像儲存系統支援6個月內的影像資料調閱,如超出6個月,臨床科醫生無法及時甚至不能調閱歷史影像檔案,進而影響看診效率,急需高效、智慧的儲存系統滿足業務需求。

l    資訊需集中管理和共享

此前PACS只能把處理好的影像手工複製到影像釋出系統,並提供給臨床科醫生進行調閱診斷,其他科室的資料儲存在各科室工作站,資訊無法集中管理和共享。

 

解決方案

基於此,醫療單位必須透過升級傳統儲存架構及資料呼叫模式,才能應對當下對於快速擴張的儲存的需求。經過多次的行業調研及產品對比測試,該院最終採用杉巖資料分散式物件儲存解決方案,架構如下圖所示:

                                             

 

底層儲存改造成雲端儲存池架構,並異構原有的傳統儲存,進行統一管理。影像釋出系統直接讀取熱儲存池近一年的影像資料,並且無需生產PACS進行影像複製,節省儲存資源,並加快了PACS系統和釋出系統的執行效率。其他科室(皮膚科等)的文件統一採用seafile文件管理系統進行集中管理和共享,資料集中儲存在溫儲存池。雲端儲存池可以直接設定歸檔策略,無需上層系統進行資料分級歸檔。

相關容量方案設計:

此前該三甲醫院PACS系統一天產生30萬張影像,每張CT影像大小為500K,每張DR、胸片大小為12M。一天增長近200G的資料量,一年增長高達72T。

 

資料型別

檔案型別

檔案大小

每天檔案增數

每天資料增量

每月資料增量

一年資料增量

CT

小圖片

500K

30

200G

6T

72T

DR

胸片

圖片

12M

 

生產PACS系統歷史歸檔資料總量為150T,其他科室(皮膚科、婦產科、神經內外科等)需要30T儲存空間進行集中儲存和管理。雲端儲存裸空間需求為500T (熱儲存池裸容量200T, 溫儲存池250T,光儲存池50T),底層資料採用副本或糾刪的保護機制保障資料的安全。

 

最新設計的分散式儲存方案中,熱池和溫池分別按照存放1年和2年的資料進行容量設計,即19年資料直接寫入熱池, 17年到18年兩年的資料直接遷移至溫池,17年以前的資料直接歸檔遷移到光儲存。資料在磁碟儲存停留3年之後,離線歸檔到冷儲存(光存)。按照目前的統計,該院每年新增約80TB影像資料,按照存放時間,熱池和溫池分別設計100TB和200TB的可用空間,後續業務增長,只需擴容光儲存即可。如果因業務增長,每年資料增速提高,則按需求和比例對熱、溫、冷進行擴容。

 

儲存裝置的最終裸容量P的計算應該綜合考慮業務可用容量需求p,硬碟折損率r,以及副本或糾刪碼(4+1)的可用空間率s,其中,硬碟折損率r的計算公式為:r=(1000/1024) 4 = 0.91

兩副本的可用空間率s1:s1=1/2=0.5;糾刪碼的可用空間率s1:s2=4/5=0.8

裸容量P和可用容量p,以及硬碟折損率r,糾刪碼可用空間率s之間的關係是:p=P*r*s

因此裸容量(按硬碟廠商的規格計算)可用透過如下公式進行計算:P=p/(r*s)

按一年的資料增長量為72T-80T,並且考慮到未來影像資料的增加和影像清晰度的要求,影像需調閱原圖。 PACS系統規劃的熱儲存池可用容量100T(儲存一年的資料),由於讀寫效能要求比較高,建議採用兩副本儲存方案。而且主要是小檔案頻繁讀寫,為了綜合考慮成本,儲存主要採用SATA機械盤,利用兩塊SATA SSD做一些關鍵後設資料儲存加速。

熱儲存池的可用容量計算公式如下:200T*0.91*0.5=91T

溫儲存池由於讀寫效能要求沒有熱儲存池高,採用EC糾刪碼儲存方案,另外其他科室(皮膚科等)的資料統一儲存在溫儲存池,儲存伺服器可以考慮多盤位的伺服器,降低儲存硬體成本。

可用空間計算公式:250T*0.91*0.8=182T(儲存兩年資料),冷儲存池(光儲存)的可用空間為50T。

 

 

方案價值

透過此次方案改造,藉助杉巖資料的海量物件儲存(SandStone MOS)解決方案,充分利用原有儲存裝置,將PACS影像系統的檔案儲存替換成SandStone MOS,生產系統將檔案儲存在一個易擴充套件、容量大的儲存池,簡化架構,便於統一管理和運維監控。將1年的資料轉移到更低成本的硬體上;2年以上的資料歸檔到藍光儲存上永久儲存,滿足法規15年以上保留要求。透過納管原有儲存系統,實現資料集中管理和無縫遷移。系統採用雜湊計算替代索引查詢訪問檔案,在資料儲存方面採用創新性的檔案合併方式,最佳化了小檔案的訪問效能。SandStone MOS內建檢索引擎,打破資料孤島,實現資料共享,大大提升了PACS的執行效率。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69956769/viewspace-2667719/,如需轉載,請註明出處,否則將追究法律責任。

相關文章