RSSD塊儲存的應用場景和技術詳解,你明白這些優勢嗎?

陝西優就業發表於2019-06-11

塊儲存作為雲端計算的基礎元件,可以為雲伺服器提供可隨機讀寫能力,且具備持久化儲存、高可靠、低時延特性。同時採用多副本冗餘,能避免網路硬體故障而導致的資料不可用。UCloud技術總監彭晶鑫在現場分享時提到,利用分散式技術,塊儲存可以實現計算和儲存分離,它帶來的好處有:

1.線上遷移。預測機器故障前,我們將虛機遷移至另外一臺健康的宿主機時,不需要遷移磁碟的資料,只需遷移CPU和記憶體,整個過程可在幾十秒內完成。如果沒有計算儲存分離,可能要持續數十分鐘甚至幾個小時,而且線上遷移的過程非常影響使用者的IO體驗。

2.當機恢復。如果宿主機當機,我們只需要利用遠端的分散式儲存,在另外一臺宿主機上分配CPU和記憶體就可以快速在新的宿主機上拉起虛機,當機的恢復速度基本能在一分鐘內完成。如果沒有計算儲存分離,可能要數十分鐘甚至更長時間。

3.高可用高可靠性。透過分散式技術在後端能夠發現節點故障並在幾秒的時間內剔除掉有故障的副本,從而避免節點硬體故障、網路故障等帶來的儲存資料問題和可用性問題。

4.儲存池化。透過分散式儲存組成較大的池化容量,且實現了按需分配儲存空間,避免本地儲存碎片過多問題,透過軟體層面的一些設計甚至可提供超大容量儲存,例如32TB、40TB、100TB。

過去幾年,儲存行業的底層軟硬體技術發生了快速的發展,儲存介質方面,從HDD 到 SATA SSD 再到NVMe SSD ,效能提升了百倍;網路介面上,從千兆、萬兆到100G,網路介面也迎來跨越式發展。UCloud塊儲存團隊面對這些發展,做了很多底層研發設計的工作,體現在產品上就是從普通雲盤升級為SSD雲盤,IOPS從1000提高到2.4萬,時延從5-10毫秒降低到0.5-3毫秒。加上今年推出的最新型RSSD雲盤,IOPS提升50倍至120萬,順序吞吐量提升18倍,延遲降低至0.1毫秒。

為了推出這樣一款超高效能的RSSD雲盤,UCloud在系統層面做了大量工作來徹底壓榨NVMe的硬體能力。首先是在client側利用vhost user技術,透過vring實現虛機到儲存client的資料零複製。網路協議用RoCE代替TCP,RoCE能提供一種特別清晰簡單的訊息機制,讓應用程式可以直接訪問兩端的記憶體,完全繞過kernel,使4K讀寫的網路包收發時延降到10微秒。然後儲存讀寫上用SPDK代替libaio,SPDK提供使用者態IO讀寫,高併發下依然能保持較低的時延。IO路徑整體保持在使用者態,並使用執行緒輪詢減少使用者態核心態間的切換,減少中斷帶來的損耗。透過這種整體的軟硬體協同設計,RSSD雲硬碟效能獲得極大的提升,延時得到很大程度的降低。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69902581/viewspace-2647297/,如需轉載,請註明出處,否則將追究法律責任。

相關文章