大資料儲存系統對比:Ceph VS Gluster
【IT168 編譯】在分散式儲存領域,Ceph和Gluster是兩個很常見的開源軟體平臺,可以用來儲存和管理大量資料。在進行技術選型時,對比兩者很有必要,它們的區別主要體現在資料儲存方式和檢索的複雜性上。
Ceph和Gluster都被歸類為SDS,即“軟體定義的儲存”。作為開源軟體,它們為使用者提供了連線任何已支援軟體或硬體的靈活性,而不必擔心提供商可能對作業系統施加一些限制。
RedHat的副總裁兼總經理Ranga Rangachari將這兩個專案的區別描述為:
Ceph是OpenStack的一個重要部分。在社群中,大多數OpenStack實現都使用Ceph作為儲存底層。Gluster則是典型的檔案服務、二級儲存和深度歸檔。
簡單地說,Ceph和Gluster都提供了強大的儲存能力,但是Gluster在更高的級別上表現得很好,可以在短時間內從TB增加到PB級。Ceph確實提供了快速的儲存擴充套件,但是其儲存格式適合於使用者更頻繁訪問的短期儲存。
概述
Ceph:具有塊和檔案功能的可擴充套件物件儲存
Gluster:具有物件功能的可擴充套件檔案儲存
Ceph使用物件儲存,這意味著它將資料儲存在分佈在許多計算機上的二進位制物件中。它利用OpenStack技術構建了一個私有云系統,使用者可以在同一個系統中混合非結構化和結構化資料。
Gluster使用塊儲存,它在連線的Linux計算機的開放空間中以塊的形式儲存一組資料。它構建了一個高度可擴充套件的系統,可以訪問更傳統的儲存和檔案傳輸協議,並且可以快速擴充套件,而且不會出現單點故障。這意味著您可以儲存大量舊資料,而不會丟失可訪問性或安全性。IOP Science 2014年4月的一項研究顯示,Gluster的表現優於Ceph,但仍存在一些不穩定性,可能會導致部分或全部資料丟失。
與檔案的互動
兩者都使用標準POSIX或NFS介面,使用者可以像透過標準檔案系統一樣與資料進行互動。為你儲存的資料提供搜尋和檢索介面。
Ceph在叢集中的計算機之間分發資料,允許使用者透過介面一次訪問所有資料。在後端,CephFS與叢集的不同部分通訊並儲存資料,而無需太多使用者干預。多個客戶端也可以訪問儲存資料,無需干預。
Ceph控制皮膚,透過Calamari管理和監控系統
Gluster同樣將資料分發給連線在一起的計算機,但是資料儲存是分塊進行的,所有東西都儲存在一起。GlusterFS會在任意儲存位置為資料找到適當大小的儲存區域,放置要儲存的資料,並建立一個標識雜湊。該程式在核心系統上儲存資料,不會生成另一個後設資料系統,而是為檔案建立一個惟一的雜湊。在沒有後設資料伺服器干擾的情況下,Gluster響應和擴充套件得比競爭對手要更快,但仍然保持可用性。從介面上看,使用者將以目錄的形式看到他們的資料塊。因為每個檔案都有一個惟一的雜湊,使用者必須在重新命名之前複製一份,否則就會失去對資料的訪問權。
GDash - GlusterFS控制皮膚
另外
Ceph需要以奇數形式分佈在整個系統中的監視節點,以獲得仲裁集並減少“裂腦”(split-brain)問題出現和資料丟失的可能性。
Gluster的預設塊大小是Ceph的兩倍:Gluster是128k, Ceph是64k。Gluster聲稱增加的塊大小可以加快處理速度,但是隻要稍做一些工作,就可以增加Ceph的塊大小並增加功能。
這兩個程式都是開源的,但是企業可以透過購買第三方管理解決方案連線到Ceph和Gluster的。最流行的管理工具分別出自以下廠商:
Ceph:InkTank,RedHat,Decapod,Intel,
Gluster:RedHat
結論
是否使用Ceph和Gluster取決於許多因素,但是兩者其中任何一個都可以提供可擴充套件和穩定的資料儲存。尋找易於訪問、可以快速縱向擴充套件的儲存空間的企業可能適合使用Ceph。那些計劃儲存大量資料而不需要太多移動的人可能應該關注一下Gluster。
附:Ceph與GlusterFS對比表格
原文連結: https://technologyadvice.com/blog/information-technology/ceph-vs-gluster/
來自 “ technologyadvice ”,原文連結:http://blog.itpub.net/31545805/viewspace-2217966/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 面向不同需求的物件儲存系統對比:Ceph與Swift物件Swift
- 大資料檔案儲存系統HDFS大資料
- 【北亞企安資料恢復】Ceph儲存原理&Ceph資料恢復流程資料恢復
- 什麼是大資料系統儲存及管理?大資料
- 面向海量資料,一篇文章認識Ceph分散式儲存系統分散式
- CEPH分散式儲存搭建(物件、塊、檔案三大儲存)分散式物件
- Ceph儲存池管理
- 滴滴Ceph分散式儲存系統優化之鎖優化分散式優化
- 分散式儲存ceph 物件儲存配置zone同步分散式物件
- 分散式檔案系統HDFS,大資料儲存實戰(一)分散式大資料
- 資料儲存加密的主流方案對比與難點解析加密
- 物件儲存 vs 檔案儲存 vs 塊儲存,選哪個?物件
- 【大資料】BigTable分散式資料儲存系統分散式資料庫 | 複習筆記大資料分散式資料庫筆記
- CEPH-4:ceph RadowGW物件儲存功能詳解物件
- 本地儲存VS雲端儲存:區別不只是資料存放位置
- 配置Kubernetes共享使用Ceph儲存
- 不要Ceph,青雲自己做了一套QingStor檔案儲存系統
- 滴滴Ceph分散式儲存系統最佳化之鎖最佳化分散式
- 大資料時代對儲存發展需要哪些要求大資料
- Greenplum海量資料,大寬錶行存VS列存
- 資料庫選型比對 Oracle vs sqlserver資料庫OracleSQLServer
- 【儲存資料恢復】IBM儲存檔案NTFS系統損壞的資料恢復案例資料恢復IBM
- 資料湖 vs 資料倉儲 vs 資料庫資料庫
- 儲存系統
- 星環科技多模型資料統一儲存的大資料分散式儲存平臺方案分享模型大資料分散式
- 比較 Apache Hadoop 資料儲存格式 - techwellApacheHadoop
- Oracle vs PostgreSQL,研發注意事項(4)- PageSize對資料儲存的影響OracleSQL
- [資料庫系統]儲存和檔案結構資料庫
- 分散式系統技術:儲存之資料庫分散式資料庫
- 分散式系統中資料儲存方案實踐分散式
- ceph儲存的monitor選舉流程
- 圖資料庫對比:Neo4j vs Nebula Graph vs HugeGraph資料庫
- 資料儲存--檔案儲存
- 希捷Exos Corvault儲存系統為資料洞察賦能希捷
- 分散式系統中的資料儲存方案實踐分散式
- kubernetes配置後端儲存 rook-ceph後端
- Ceph分散式儲存技術解讀分散式
- TIDB儲存TiKV的鍵值對資料TiDB