大資料儲存系統對比:Ceph VS Gluster

儲存頻道發表於2018-10-29

   【IT168 編譯】在分散式儲存領域,Ceph和Gluster是兩個很常見的開源軟體平臺,可以用來儲存和管理大量資料。在進行技術選型時,對比兩者很有必要,它們的區別主要體現在資料儲存方式和檢索的複雜性上。

  Ceph和Gluster都被歸類為SDS,即“軟體定義的儲存”。作為開源軟體,它們為使用者提供了連線任何已支援軟體或硬體的靈活性,而不必擔心提供商可能對作業系統施加一些限制。

  RedHat的副總裁兼總經理Ranga Rangachari將這兩個專案的區別描述為:

   Ceph是OpenStack的一個重要部分。在社群中,大多數OpenStack實現都使用Ceph作為儲存底層。Gluster則是典型的檔案服務、二級儲存和深度歸檔。

  簡單地說,Ceph和Gluster都提供了強大的儲存能力,但是Gluster在更高的級別上表現得很好,可以在短時間內從TB增加到PB級。Ceph確實提供了快速的儲存擴充套件,但是其儲存格式適合於使用者更頻繁訪問的短期儲存。

   概述

  Ceph:具有塊和檔案功能的可擴充套件物件儲存

  Gluster:具有物件功能的可擴充套件檔案儲存

  Ceph使用物件儲存,這意味著它將資料儲存在分佈在許多計算機上的二進位制物件中。它利用OpenStack技術構建了一個私有云系統,使用者可以在同一個系統中混合非結構化和結構化資料。

  Gluster使用塊儲存,它在連線的Linux計算機的開放空間中以塊的形式儲存一組資料。它構建了一個高度可擴充套件的系統,可以訪問更傳統的儲存和檔案傳輸協議,並且可以快速擴充套件,而且不會出現單點故障。這意味著您可以儲存大量舊資料,而不會丟失可訪問性或安全性。IOP Science 2014年4月的一項研究顯示,Gluster的表現優於Ceph,但仍存在一些不穩定性,可能會導致部分或全部資料丟失。

   與檔案的互動

  兩者都使用標準POSIX或NFS介面,使用者可以像透過標準檔案系統一樣與資料進行互動。為你儲存的資料提供搜尋和檢索介面。

  Ceph在叢集中的計算機之間分發資料,允許使用者透過介面一次訪問所有資料。在後端,CephFS與叢集的不同部分通訊並儲存資料,而無需太多使用者干預。多個客戶端也可以訪問儲存資料,無需干預。

Ceph控制皮膚,透過Calamari管理和監控系統

  Gluster同樣將資料分發給連線在一起的計算機,但是資料儲存是分塊進行的,所有東西都儲存在一起。GlusterFS會在任意儲存位置為資料找到適當大小的儲存區域,放置要儲存的資料,並建立一個標識雜湊。該程式在核心系統上儲存資料,不會生成另一個後設資料系統,而是為檔案建立一個惟一的雜湊。在沒有後設資料伺服器干擾的情況下,Gluster響應和擴充套件得比競爭對手要更快,但仍然保持可用性。從介面上看,使用者將以目錄的形式看到他們的資料塊。因為每個檔案都有一個惟一的雜湊,使用者必須在重新命名之前複製一份,否則就會失去對資料的訪問權。

GDash - GlusterFS控制皮膚

   另外

  Ceph需要以奇數形式分佈在整個系統中的監視節點,以獲得仲裁集並減少“裂腦”(split-brain)問題出現和資料丟失的可能性。

  Gluster的預設塊大小是Ceph的兩倍:Gluster是128k, Ceph是64k。Gluster聲稱增加的塊大小可以加快處理速度,但是隻要稍做一些工作,就可以增加Ceph的塊大小並增加功能。

  這兩個程式都是開源的,但是企業可以透過購買第三方管理解決方案連線到Ceph和Gluster的。最流行的管理工具分別出自以下廠商:

  Ceph:InkTank,RedHat,Decapod,Intel,

  Gluster:RedHat

   結論

  是否使用Ceph和Gluster取決於許多因素,但是兩者其中任何一個都可以提供可擴充套件和穩定的資料儲存。尋找易於訪問、可以快速縱向擴充套件的儲存空間的企業可能適合使用Ceph。那些計劃儲存大量資料而不需要太多移動的人可能應該關注一下Gluster。

  附:Ceph與GlusterFS對比表格

大資料儲存系統對比:Ceph VS Gluster

  原文連結: https://technologyadvice.com/blog/information-technology/ceph-vs-gluster/


來自 “ technologyadvice ”,原文連結:http://blog.itpub.net/31545805/viewspace-2217966/,如需轉載,請註明出處,否則將追究法律責任。

相關文章