在 180 節點叢集中實現了 6.6 TiB/s 的聚合讀取吞吐量; 在 25 節點叢集的 GraySort 基準測試中達到 3.66 TiB/min 的吞吐量; 每個客戶端節點在 KVCache 查詢時可達到 40+ GiB/s 的峰值吞吐量; 採用分離式架構,具有強一致性語義。


開源連結:https://github.com/deepseek-ai/3FS Smallpool(3FS 上的資料處理框架):https://github.com/deepseek-ai/smallpond


分離式架構。結合了數千個 SSD 的吞吐量和數百個儲存節點的網路頻寬,使應用程式能夠以不受位置限制的方式訪問儲存資源。
強一致性。實現了帶有分配查詢的鏈式複製(CRAQ)以保證強一致性,使應用程式程式碼簡單且易於理解。
檔案介面。開發了由事務性鍵值儲存(如 FoundationDB)支援的無狀態後設資料服務。檔案介面廣為人知且隨處可用。無需學習新的儲存 API。
資料準備。將資料分析管道的輸出組織成層次化的目錄結構,並高效管理大量中間輸出。
資料載入器。透過支援跨計算節點對訓練樣本的隨機訪問,消除了預取或打亂資料集的需求。
檢查點儲存。支援大規模訓練的高吞吐量並行檢查點儲存。
用於推理的 KVCache。為基於 DRAM 的快取提供了一種成本效益高的替代方案,提供高吞吐量和顯著更大的容量。







