大資料分散式儲存的部署模式:分離式or超融合
大資料分散式儲存的部署模式:分離式or超融合
資料中心內部系統的核心要求是“穩定可靠”,一是指系統在執行過程中有能力提供連續可靠的服務,長時間無故障執行;二是指當故障發生之後,有能力快速定位,及時排查,故障範圍不蔓延。
分離式部署的方式,使得系統與雲平臺系統相獨立,避免了計算和儲存爭搶CPU/記憶體/網路等物理資源,一旦某一方資源需求驟升導致的另一方資源枯竭,從而影響效能並在整個基礎架構中產生的漣漪效應;和在超融合部署方式在叢集規模較大後,網路、硬碟、伺服器發生故障的概率都會增大;以及資料重刪、壓縮、加密糾刪碼等功能、故障的自修復和資料功能實現都會消耗一定的系統資源,導致效能下降和抖動等問題。
分離式部署相比超融合方式的優點:
如此觀點如果不是出自某廠家或者供應商,也太偏頗了。我覺得簡單看兩種技術適合不同規模,中小規模(包括平臺規模,也包括人力資源規模)下超融合優勢明顯,大規模分散式儲存優勢更大。良好的設計,恰當的平衡才是關鍵,沒有一邊倒的絕對優勢。
建議採用超融合式部署模式。
1、從成本上講,超融合式每個伺服器既可以做計算資源,又可以做儲存資源,價效比最高。
2、從效能上講,分散式存系統,一般只佔用伺服器資源的10%左右,還有90%的效能可以使用。而且目前X86伺服器的CPU效能越來越高,如果閒置不用,比較可惜,利用率太低。
3、從管理上講,每臺X86物理裝置都一樣,方便橫向擴充套件和管理,每增加一個節點,就同時增加了計算資源和儲存資源,有利於管理。目前,百度和阿里的雲資料中心基本都是這麼做的。
一、 超融合的概念
超融合(Hyper- Converged)目前還沒有一個嚴格的標準定義, 各個廠商和機構都有各自的定義,這也說明超融合仍然處於快速發展演變當中,並未形成統一的標準規範。 超融合中“超”對應英文“Hyper”,特指虛擬化,對應虛擬化計算架構,如 KVM、XEN、Hyper-V 等。這一概念最早源自 Nutanix 等儲存 廠商將 Google/Facebook 等網際網路廠商採用的計算儲存融合架構用於 虛擬化環境,為企業客戶提供一種基於 X86 硬體平臺的計算儲存融 合產品或解決方案。按照這個概念,資料庫一體機和大資料一體機都 不能為超融合的範疇,因為RAC/Hadoop等應用並非執行在虛擬機器 之上。此外,超融合架構中最根本的變化是儲存,由原先的集中共享 式儲存(SAN/NAS)轉向軟體定義儲存,特別是分散式儲存。
超融合中的“融合”是指計算和儲存部署在同一個節點上,同時提供計算和儲存能力。融合一般可以分為物理融合和超融合兩種,超融 合是融合的一個子集。物理融合系統中,計算和儲存仍然可以是兩個 獨立的元件,沒有直接的相互依賴關係,共享主機的物理資源。超融 合與物理融合不同在於,重點以虛擬化計算為中心,計算和儲存緊密 相關,儲存由控制器虛擬機器(Controller VM,CVM)而非物理機來控 制並將分散的儲存資源形成統一的儲存池,用於建立使用者的應用虛擬機器。物理融合與超融合對比如所示。出於效能考慮,超融合架構通常 都需要將主機物理裝置透傳(Pass Through)給控制器虛機 CVM。
超融合架構是基於標準通用的硬體
平臺,通過軟體定義實現計算、儲存、網路融合,實現以虛擬化為中 心的軟體定義資料中心的技術架構。要判斷一套系統是否採用超融合 架構,主要基於以下幾點:
(1) 完全軟體定義。獨立於硬體,採用商業通用標準硬體平臺(如 X86),完全採用軟體實現計算、儲存、網路等功能。
(2) 完全虛擬化。以虛擬化計算為中心,計算、儲存、網路均由 虛擬化引擎統一管理和排程,軟體定義儲存由虛擬機器控制器 CVM 進 行管理。
(3) 完全分散式。橫向擴充套件的分散式系統,計算、儲存、網路按 需進行動態擴充套件,系統不存在單點故障,採用分散式儲存。
二、 超融合架構發展情況和案例
未來 5 至 10 年新一代資料中心基礎架構朝著軟體定義和超融合 方向發展,SAN/NAS 儲存逐漸被軟體定義的儲存所替代。在軟體定 義儲存(SDS)的推動下,超融合將成為資料中心基礎架構的核心, 並且是軟體定義資料中心(SDDC)的未來技術發展趨勢。基於多種 複雜裝置的資料中心最終會歸一化成以通用伺服器加互連網路的體 系架構。在這些通用伺服器上部署關鍵的軟體,通過虛擬化的方式實 現計算、儲存資源。然後再在這些虛擬化資源的基礎上部署應用,完 成具體功能。
儲存、計算和網路的深度融合是未來IT基礎設施發展的大趨勢, 超融合架構因此成為企業級客戶的首選,加速業務系統從傳統架構向 雲端計算架構的轉型。IDC 的統計報告顯示,2016 年全球超融合市場規 模預計將增長 94%。另一家市場分析公司 Gartner 預計,2019 年全球 超融合市場的規模將超過 1000 億美元,有大約 30%安裝在企業資料 中心內的儲存陣列都將是部署在軟體定義儲存或者基於 x86 硬體系 統的超融合整合系統架構。
2016 年以來,中國超融合市場持續升溫,越來越多的超融合團隊 逐漸發展起來。根據市場研究和諮詢公司 Gartner 在 2016 年 11 月針 對中國超融合市場趨勢釋出的報告,思科、HP、Dell、EMC、NetApp 等老牌伺服器和儲存大廠紛紛將技術與產品戰略轉向超融合的路線 上來。報告指出,中國一躍成為全球超融合基礎架構增速最快的市場,
國內的 H3C、華為、Nutanix、聯想、SmartX、深信服等廠商迅速跟 進了國際主流超融合解決方案。
目前超融合架構在國內的主要應用案例如下:
政府相關機構:中國檢查出版社,中國證監會,中國網際網路資訊 中心,中國大連市政府,青海水利,廣州地稅局資料庫虛擬化,國家衛計委雲資料中心,湖北省公安廳審計平臺,廈門公安局警務雲平臺, 最高法司法統計管理平臺,深圳海關業務系統,廣東海事局智慧海事 平臺,中國(西安)絲綢之路研究院,溫州醫科大學第一附屬醫院等。
金融行業:招商銀行,中銀證券,南京證券,中信銀行等。 製造行業:東風本田,寶山鋼鐵,中鐵資源集團有限公司等。 IT 企業:科陸電子,聯想集團,中國聯通沃雲,中國電信等。 教育行業:中國地質大學,中國科技大學,南開大學,北京郵電大學,北京外交學院,陝西省行政學院等。
三、 超融合架構的優勢
超融合架構迅速發展的原因是其具有顯著的優勢,能夠帶來極高 的客戶價值。超融合架構實現了計算、儲存、網路等資源的統一管理 和排程,具有更彈性的橫向擴充套件能力,可以為資料中心帶來最優的效 率、靈活性、規模、成本和資料保護。使用計算儲存超融合的一體化 平臺,替代了傳統的伺服器加集中式儲存的架構,使得整個架構更清 晰簡單,極大簡化了複雜 IT 系統的設計。
超融合架構關鍵特徵之一就是易於擴充套件,最小部署,按需擴容。 超融合廠商宣稱最大叢集規模也差別很大,從數十到數千節點不等, 通常從 3 節點起配。超融合中計算能力、儲存效能和容量是同步擴容 的,無法滿足現實中單項能力的擴充套件,有些廠商還對擴容最小單元有 要求,擴充套件靈活性會受到限制。
叢集達到一定規模後,系統架構複雜性就會非線性增加,叢集管 理變的更加困難,硬體故障和自修復發生的概率也會大大增加。因此, 超融合架構一般不建議構建大叢集,如果業務允許儘量構建多個適當 規模的較小叢集,或者採用大叢集中構建故障域或子資源池的方式。
物理裝置透傳給控制虛機,增加了部署配置管理的複雜性。計算和存 儲對硬體平臺的要求都不同,融合後也會一定程度上增加相容性驗證的複雜性。超融合架構下,管理、計算、儲存、高可用通常都需要配置獨立的虛擬網路,網路配置也會更加複雜。同時,共享物理資源的 分配、隔離、排程,這也是額外增加的複雜性。如果出現故障,問題的跟蹤除錯和分析診斷也變得更加困難。
超融合架構下的儲存邏輯單元已經擁有了很多過去高階儲存才具備的功能,但是在資料保護,複製,容災,高可用,這些關係到資料儲存層面的需求是超融合廠商不會花精力去關注也無法關注的,同時架構本身的侷限性帶來的使用者選擇面也比較窄,你無法把超大規模的計算中心全部塞滿超融合架構,使用者對於結構化和非結構化資料的海量增長這種資料儲存的異構需求不適合全部交給超融合來解決,很多使用者原本希望計算跟儲存分佈擴容,或者計算跟儲存佔比比較失衡的情況,比如計算資源需求很大,儲存資源需求很小,或者相反的情況全部交給超融合,這樣一股腦全部交給超融合的架構設計是相當糟糕的。
相關文章
- 分離式or超融合,分散式儲存建設時的兩種部署模式分散式模式
- 大資料儲存解決方案中的分離式與超融合部署大資料
- 分散式儲存中的資料分佈策略分散式
- 【大資料】BigTable分散式資料儲存系統分散式資料庫 | 複習筆記大資料分散式資料庫筆記
- 超融合、軟體定義儲存、分散式儲存以及Server SAN的區別與聯絡分散式Server
- 山東常林集團攜手杉巖資料:超融合+分散式儲存為業務提速分散式
- 分散式資料恢復-hbase+hive分散式儲存資料恢復方案分散式資料恢復Hive
- 004.MinIO-DirectPV分散式儲存部署分散式
- 淺談分散式儲存系統的資料分佈演算法分散式演算法
- 星環科技多模型資料統一儲存的大資料分散式儲存平臺方案分享模型大資料分散式
- 分散式儲存的六大優點分散式
- 全球分散式雲大會:AntDB超融合流式實時數倉,打造分散式資料庫新紀元分散式資料庫
- Redis 分散式儲存Redis分散式
- HDFS分散式儲存分散式
- 分散式儲存概述分散式
- 分散式檔案系統HDFS,大資料儲存實戰(一)分散式大資料
- DAOS 分散式非同步物件儲存|資料平面分散式非同步物件
- Hadoop 分散式儲存分散式計算Hadoop分散式
- 存算分離是否成為開源分散式資料庫主流架構?分散式資料庫架構
- CEPH分散式儲存搭建(物件、塊、檔案三大儲存)分散式物件
- 分散式系統中的資料儲存方案實踐分散式
- Hadoop HDFS 3.3.1分散式儲存搭建Hadoop分散式
- 分散式系統技術:儲存之資料庫分散式資料庫
- 分散式文件儲存資料庫之MongoDB索引管理分散式資料庫MongoDB索引
- 分散式文件儲存資料庫之MongoDB副本集分散式資料庫MongoDB
- 聊聊大資料的存算分離大資料
- 02 . 分散式儲存之FastDFS 高可用叢集部署分散式AST
- Ceph分散式儲存-原理介紹及簡單部署分散式
- 哪些企業需要分散式式儲存?分散式
- 10分鐘搞懂:億級使用者的分散式資料儲存解決方案!分散式
- Nutanix支援超融合環境中部署大資料大資料
- 分散式文件儲存資料庫之MongoDB分片叢集分散式資料庫MongoDB
- 分散式文件儲存資料庫之MongoDB訪問控制分散式資料庫MongoDB
- 崑崙分散式資料庫儲存叢集 Fullsync 機制分散式資料庫
- Centos下MooseFS(MFS)分散式儲存共享環境部署記錄CentOS分散式
- 分散式儲存轉崗記分散式
- 分散式儲存技術概念分散式
- 超融合一體流式引擎,打造分散式資料庫新紀元分散式資料庫