[媒體]PCIe NVMe SSD準備“蠶食”企業級儲存系統了

memblaze_2011發表於2017-12-14

談到企業級儲存系統不得不提到SAS,雙埠SAS硬碟取代FC和SATA硬碟成為企業儲存系統的標配,磁碟陣列的背板、HBA卡等元件也是基於SAS標準而做的。SAS體系演進至今已經非常成熟,直到PCIe SSD的出現,尤其是NVMe協議體系走向成熟之後,SAS優勢越來越少。

不只適用於盤 企業級儲存是NVMe更大的舞臺

NVMe介面標準擁有諸多優勢,首先NVMe標準是面向PCIe SSD的,使用原生PCIe通道與CPU直連可以免去SATA與SAS介面的外接控制器與CPU通訊所帶來的延時,高效能是NVMe相對SAS等協議的首要優勢

其次,早期的PCIe SSD都面臨著驅動相容性問題,每個產品都有對應不同系統的專用驅動,原生PCIe SSD需要載入驅動才能夠正常引導。NVMe標準的出現解決了系統相容性問題,NVMe SSD無需廠家提供相應的驅動就可以正常工作,目前Windows、Linux、Solaris、Unix、VMware、UEFI等都加入了對NVMe SSD的支援。

高效能和標準化帶來的易用性在PCIe SSD大規模部署和高負載場景下就會顯露出來,比如做快取,做本地儲存,做分散式儲存、ServerSAN等。

但需要指出的是,今天的NVMe協議體系已經趨於成熟,其並非僅僅適用於一個SSD盤,一個系統也可以是NVMe,包括全快閃記憶體陣列、全快閃記憶體的一體機高效能SAN和NAS系統等。這就拓寬了NVMe的應用,準備“蠶食”企業級儲存系統了。

基於NVMe SSD的企業級儲存系統

Memblaze副總裁張泰樂博士在2017儲存峰會上介紹到,與傳統的SAS儲存架構相比,基於NVMe企業級儲存架構直接通過PCIe Switch將NVMe SSD與CPU相連,這個路徑短,由於NVMe本身對多核CPU支援非常好,能夠充分利用CPU資源,所以基於NVMe 的儲存系統效能可以做的非常高。


Memblaze副總裁張泰樂博士

當前已經有包括Pure Storage在內的諸多廠商都在做全快閃記憶體陣列,由於分散式軟體系統的快速進化和迭代,很長時間裡基於x86標準伺服器的分散式全快閃記憶體系統非常多,這類產品通過多副本等軟體層面的資料保護技術保障資料安全和業務連續,系統硬體層面的高可用性考量則是欠缺的。

而全快閃記憶體陣列則以SAS SSD居多,原生NVMe SSD的全快閃記憶體陣列尚在爆發前夕。要設計一款NVMe SSD全快閃記憶體陣列,需要盤到系統控制器、主機板、資料保護演算法乃至系統上每個軟硬體環節的徹底革新。

全快閃記憶體陣列首先要做的是系統級的高可靠和高可用性,這點基於SAS的儲存系統則對全快閃記憶體陣列有著諸多的借鑑意義。(下圖是一個基於NVMe SSD的儲存架構)


基於雙埠NVMe SSD的企業級儲存系統
從上圖不難看出,要把NVMe推向企業級儲存系統,首先要做雙埠盤,實現盤級高可用性。雙埠是SAS盤的主要特性,這也是早期PCIe SSD能夠輕鬆替代系統中SATA SSD,但卻無法取代SAS SSD的主要原因之一。雙埠盤兩個伺服器連到一個盤上,單個鏈路出現掉電、短路等故障並不會影響盤嚮應用提供服務。NVMe SSD的雙埠需要Memblaze與儲存陣列以及PCIe交換機等廠商共同努力才能轉化為系統高可用性的有效保障力量。

除此之外,高密度的JBOF設計是NVMe時代另一個關鍵問題。張泰樂談到,相比JBOD,基於NVMe SSD的高密度JBOF面臨著一些新的挑戰。首先是供電。一個NVMe SSD功耗在25w左右,約為SAS SSD的兩倍,這意味著一個60盤位的JBOF需要提供至少1500w的功率給硬碟,而一個主流的60盤位高密度JBOD的電源功率只有1700w,所以JBOF首先要在電源、硬碟背板的供電設計上做以改進。其次,功率大了之後,機箱的風扇、風道等散熱系統需要更加高效,如果機箱內溫度過高,容易影響SSD的壽命和穩定性。

複雜的佈線。每個U.2介面的盤普遍採用PCIe3.0 x4介面,每個Lane需要4根線用於資料傳輸。此外還需要兩個時鐘線。這意味著一個60盤位的JBOF需要布超200根線。這對於背板和主機板設計要求都非常高。

對於高密度JBOF的設計,Memblaze從U.2盤的設計上提出兩個方案。第一個是做低功耗的NVMe SSD。當NVMe SSD功耗降到接近SAS SSD的水平,那麼機箱的電源、背板,甚至風扇的設計難度都將有質的降低,甚至原有的JBOD機箱技術可以直接拿來。據悉2018年Memblaze將會在低功率NVMe SSD上實現突破,屆時JBOF的將有更為易用的NVMe SSD。

目前,Memblaze新一代PBlaze5 PCIe NVMe SSD已經全面支援雙埠功能,多主機通過PCIe Swich實現對裝置的共同訪問,避免單主機當機導致上層業務中斷的風險,提高系統可用性。其次,通過改進SSD設計,消除時鐘也是一個重點的降低主機板佈線難度的研發方向。


Memblaze的客戶及合作伙伴

據瞭解,PBlaze5已經是Memblaze第二代NVMe 標準的PCIe SSD,集合了Memblaze最新MemSpeed 3.0 和 MemSolid3.0技術,在延遲、IOPS、效能穩定性等關鍵指標上都到達了新的高度。此外,PBlaze5 900還擁有簽名韌體、資料安全加密保護等技術全面保障裝置高可靠性、高可用性及資料安全。

隨著雙埠、低功耗盤的實現,NVMe SSD將更加適用於全快閃記憶體陣列。另一方面NVMe-oF也在高速進化,當從盤到系統乃至網路都協同走在演進的快速路上,基於NVMe SSD的企業級儲存系統成為主流是必然。


相關文章