lakeFS:實現類似於Git或事件溯源ES的物件儲存功能
lakeFS是一個開放原始碼層,可為基於物件儲存的資料湖提供彈性和可管理性。
藉助lakeFS,您可以構建可重複的,原子的和版本化的資料湖操作-從複雜的ETL作業到資料科學和分析。
lakeFS支援將AWS S3,Azure Blob儲存和Google Cloud Storage作為其基礎儲存服務。它與S3相容,並與所有現代資料框架(例如Spark,Hive,AWS Athena,Presto等)無縫相容。
資料開發環境
- 實驗-單獨嘗試工具,升級版本並評估程式碼更改。
- 可重現性-可以回到任何時間點來獲得一致的資料湖版本。
持續資料整合
- 透過執行最佳實踐來安全地攝取新資料-確保新資料來源遵循您湖的最佳實踐,例如格式和架構實施,命名約定等。
- 後設資料驗證-防止重大更改進入生產資料環境。
持續資料部署
- 即時恢復對資料的更改-如果向使用者暴露了低質量的資料,則可以立即恢復到資料湖以前,一致且正確的快照。
- 加強交叉收集的一致性-向消費者提供必須以一種原子的,可恢復的動作同步的多個資料收集。
- 透過啟用來防止資料質量問題
- 測試生產資料,然後再將其提供給使用者/消費者。
- 在您的DAG中測試中間結果,以避免級聯質量問題。
相關文章
- PostgreSQL類似OracleMERGE功能的實現SQLOracle
- 物件儲存服務的事件通知特性物件事件
- 教你如何用SQLite 實現if not exist 類似功能的操作SQLite
- 使用Kafka實現事件溯源Kafka事件
- MFC vc++ 中CTreeContrl如何自定義實現滑鼠單擊或雙擊響應事件 ,即重寫類似於控制元件的響應事件或訊息C++事件控制元件
- Java反應式事件溯源之第5部分:事件儲存Java事件
- 開源一個自用的Android事件分發中心庫,實現類似系統廣播功能。Android事件
- 基於Ceph物件儲存構建實踐物件
- 使用 .NET 整合 MinIO 實現高效物件儲存物件
- Blazor如何實現類似於微信的Tab切換?Blazor
- 用 hyperf websocket 實現,類似 qq 單機登入功能Web
- 儲存—物件儲存_Minio物件
- 實現Dart版本物件儲存(COS)外掛Dart物件
- Git的儲存原理Git
- ORACLE PL/SQL 物件、表資料對比功能儲存過程簡單實現OracleSQL物件儲存過程
- 使用Datomic實現沒有麻煩的事件溯源事件
- 塊儲存 檔案儲存 物件儲存物件
- 事件溯源:投影或投射模式 -Kacper Gunia事件模式
- 小程式–儲存圖片到相簿功能實現
- 物件儲存物件
- 事件溯源的好處在於可在軟體中捕獲現實世界 – Jessitron事件
- Chronicle事件溯源的最佳實踐事件
- 使用EventStoreDB實現事件溯源的Python開源專案事件Python
- 使用EventStoreDB實現事件溯源的Java開源專案事件Java
- eBay透過事件溯源實現持續交付事件
- DDD福音:Zeebe是一個類似Kafka的可擴充套件的分散式事件溯源工作流引擎Kafka套件分散式事件
- 頭像點選檢視大圖和儲存功能實現(儲存的細節處理)
- CEPH-4:ceph RadowGW物件儲存功能詳解物件
- 200 行程式碼實現基於 Paxos 的 KV 儲存行程
- MySQL 06 mysql 如何實現類似 oracle 的 merge intoMySqlOracle
- Java的CQRS和事件溯源ES入門:如何從CRUD切換到CQRS/ES - BaeldungJava事件
- SpringBoot整合阿里雲OSS物件儲存實現檔案上傳Spring Boot阿里物件
- 物件儲存的優勢有哪些?為什麼要選擇物件儲存?物件
- 物件儲存,未來儲存新潮流物件
- 全網最適合入門的物件導向程式設計教程:20 類和物件的 Python 實現-組合關係的實現與 CSV 檔案儲存物件程式設計Python
- UEditor實現單張圖片上傳至騰訊雲(物件儲存服務)功能(html5物件HTML
- 實現基於zoom平臺上的oss額外儲存OOM
- js實現簡易的touch事件(es5)JS事件