本文是在閱讀Introduction to Lustre* Architecture的Traditional Network File Systems vs Lustre時的筆記。
Lustre is a distributed network file system and shares some of the characteristics common to other network storage technology, namely that clients transact IO over a network and do not write data locally, the servers support concurrency, and the data is presented as a single coherent namespace.
Lustre是分散式的NFS儲存系統,因此具備分散式系統和NFS的特徵和約束。
- 作為分散式儲存,允許透過擴容實現容量、效能的線性擴充套件。
- 作為NFS,對客戶應用提供POSIX語義支援,並遮蔽儲存系統的實現細節。
分散式系統的技術點,比如:
- 分散式計算
- 分散式快取
- 預熱資料
- 老化資料
- 分散式鎖
- 分散式事務
- 分散式通訊
- RPC
- 介面的註冊
- 通訊的路由
- API通訊超時
- API通訊失敗時重試
- 訊息佇列
- 通訊模式,即同步、非同步。
- RPC
- 選舉策略
- 熱點
- 任務系統
- 週期性執行任務
- 單次執行
- 單節點執行任務
- 多節點併發執行
- 多節點序列執行
- 健康檢查
- 負載檢查
- 狀態檢查
- 負載均衡
- 叢集管理
- 擴容節點
- 縮容節點
- 配額
- QoS
- 非功能
- 效能
- 可靠性
- 故障遷移
- 安全
分散式儲存系統的技術點,比如:
- 複製資料
- 副本
- EC
- 資料的一致性
- 不一致的檢測
- 重建資料的策略
- WAL即write ahead log
- 熱點
- 訪問的熱點
- 儲存的熱點
- 自動平衡的策略
- 上層協議,比如NFS、CIFS、SMB、HDFS、FTP、S3等。
- 網路技術,比如
IB
/Ethernet
等。- 業務網路,儲存的應用、儲存的客戶端與儲存系統通訊、交換資料。
- 業務管理網路,管理員執行管理操作,接入管理系統。
- 運維管理網路,運維團隊下發日常運維操作時,接入管理系統,訪問儲存叢集中各節點。
- 儲存網路,儲存叢集中各節點內部通訊。
分散式儲存系統與傳統的單機儲存系統的差別,透過擴容可以快速實現效能的提升,比如:
- 讀頻寬/寫頻寬
- 單塊盤的讀/寫頻寬存在上限,因此同時操作的盤數量越多,可以快速提升叢集的讀/寫頻寬。
- 單機的網路頻寬存在上限,分散式儲存可透過增加節點數量,實現頻寬的線性增長。
- IOPS,單機的檔案儲存,硬體配置無法擴充套件和動態配置,因此處理的IOPS受限。對於分散式儲存,可以透過增加節點來提升IOPS。對於Lustre而言,可以透過增強MDS節點的硬體配置,或者增加MDS節點的數量,進而提升叢集的IOPS指標的表現。