Lustre架構介紹的閱讀筆記-NFS相容性

jackieathome發表於2024-04-07

本文是在閱讀Introduction to Lustre* ArchitectureTraditional Network File Systems vs Lustre時的筆記。

Lustre is a distributed network file system and shares some of the characteristics common to other network storage technology, namely that clients transact IO over a network and do not write data locally, the servers support concurrency, and the data is presented as a single coherent namespace.

Lustre是分散式的NFS儲存系統,因此具備分散式系統和NFS的特徵和約束。

  • 作為分散式儲存,允許透過擴容實現容量、效能的線性擴充套件。
  • 作為NFS,對客戶應用提供POSIX語義支援,並遮蔽儲存系統的實現細節。

分散式系統的技術點,比如:

  • 分散式計算
  • 分散式快取
    • 預熱資料
    • 老化資料
  • 分散式鎖
  • 分散式事務
  • 分散式通訊
    • RPC
      • 介面的註冊
      • 通訊的路由
      • API通訊超時
      • API通訊失敗時重試
    • 訊息佇列
    • 通訊模式,即同步、非同步。
  • 選舉策略
  • 熱點
  • 任務系統
    • 週期性執行任務
    • 單次執行
    • 單節點執行任務
    • 多節點併發執行
    • 多節點序列執行
  • 健康檢查
    • 負載檢查
    • 狀態檢查
  • 負載均衡
  • 叢集管理
    • 擴容節點
    • 縮容節點
  • 配額
  • QoS
  • 非功能
    • 效能
    • 可靠性
    • 故障遷移
    • 安全

分散式儲存系統的技術點,比如:

  • 複製資料
    • 副本
    • EC
  • 資料的一致性
    • 不一致的檢測
    • 重建資料的策略
    • WAL即write ahead log
  • 熱點
    • 訪問的熱點
    • 儲存的熱點
    • 自動平衡的策略
  • 上層協議,比如NFS、CIFS、SMB、HDFS、FTP、S3等。
  • 網路技術,比如IB/Ethernet等。
    • 業務網路,儲存的應用、儲存的客戶端與儲存系統通訊、交換資料。
    • 業務管理網路,管理員執行管理操作,接入管理系統。
    • 運維管理網路,運維團隊下發日常運維操作時,接入管理系統,訪問儲存叢集中各節點。
    • 儲存網路,儲存叢集中各節點內部通訊。

分散式儲存系統與傳統的單機儲存系統的差別,透過擴容可以快速實現效能的提升,比如:

  • 讀頻寬/寫頻寬
    • 單塊盤的讀/寫頻寬存在上限,因此同時操作的盤數量越多,可以快速提升叢集的讀/寫頻寬。
    • 單機的網路頻寬存在上限,分散式儲存可透過增加節點數量,實現頻寬的線性增長。
  • IOPS,單機的檔案儲存,硬體配置無法擴充套件和動態配置,因此處理的IOPS受限。對於分散式儲存,可以透過增加節點來提升IOPS。對於Lustre而言,可以透過增強MDS節點的硬體配置,或者增加MDS節點的數量,進而提升叢集的IOPS指標的表現。

相關文章