lakeFS:實現類似於Git或事件溯源ES的物件儲存功能
lakeFS是一個開放原始碼層,可為基於物件儲存的資料湖提供彈性和可管理性。
藉助lakeFS,您可以構建可重複的,原子的和版本化的資料湖操作-從複雜的ETL作業到資料科學和分析。
lakeFS支援將AWS S3,Azure Blob儲存和Google Cloud Storage作為其基礎儲存服務。它與S3相容,並與所有現代資料框架(例如Spark,Hive,AWS Athena,Presto等)無縫相容。
資料開發環境
- 實驗-單獨嘗試工具,升級版本並評估程式碼更改。
- 可重現性-可以回到任何時間點來獲得一致的資料湖版本。
持續資料整合
- 透過執行最佳實踐來安全地攝取新資料-確保新資料來源遵循您湖的最佳實踐,例如格式和架構實施,命名約定等。
- 後設資料驗證-防止重大更改進入生產資料環境。
持續資料部署
- 即時恢復對資料的更改-如果向使用者暴露了低質量的資料,則可以立即恢復到資料湖以前,一致且正確的快照。
- 加強交叉收集的一致性-向消費者提供必須以一種原子的,可恢復的動作同步的多個資料收集。
- 透過啟用來防止資料質量問題
- 測試生產資料,然後再將其提供給使用者/消費者。
- 在您的DAG中測試中間結果,以避免級聯質量問題。
相關文章
- PostgreSQL類似OracleMERGE功能的實現SQLOracle
- NOSQL儲存的基於事件的事務實現SQL事件
- SQLite中中實現 if not exist 類似功能SQLite
- 實現類似IE的列印網頁功能 (轉)網頁
- 使用Kafka實現事件溯源Kafka事件
- 教你如何用SQLite 實現if not exist 類似功能的操作SQLite
- 實現類似Pinterest 的圖片預載入功能REST
- 在Asp.Net中實現類似DWR的功能ASP.NET
- 物件儲存服務的事件通知特性物件事件
- Java反應式事件溯源之第5部分:事件儲存Java事件
- Blazor如何實現類似於微信的Tab切換?Blazor
- JS實現類似於微博秀的GitHub掛件JSGithub
- 用CSS實現類似導航翻轉功能例子CSS
- PHP - 實現類似於百度的實時搜尋PHP
- 基於Ceph物件儲存構建實踐物件
- es6實現的本地儲存程式碼例項
- MFC vc++ 中CTreeContrl如何自定義實現滑鼠單擊或雙擊響應事件 ,即重寫類似於控制元件的響應事件或訊息C++事件控制元件
- 開源一個自用的Android事件分發中心庫,實現類似系統廣播功能。Android事件
- 用 hyperf websocket 實現,類似 qq 單機登入功能Web
- QT實現類似於網頁step 選單效果QT網頁
- 事件溯源:投影或投射模式 -Kacper Gunia事件模式
- .Net中用js實現無重新整理類似ajax功能(例)JS
- Git的儲存原理Git
- Chronicle事件溯源的最佳實踐事件
- 事件溯源的好處在於可在軟體中捕獲現實世界 – Jessitron事件
- 實現Dart版本物件儲存(COS)外掛Dart物件
- 使用 .NET 整合 MinIO 實現高效物件儲存物件
- ORACLE PL/SQL 物件、表資料對比功能儲存過程簡單實現OracleSQL物件儲存過程
- Python實現支援JSON儲存和解析的物件PythonJSON物件
- eBay透過事件溯源實現持續交付事件
- 使用EventStoreDB實現事件溯源的Java開源專案事件Java
- 使用Datomic實現沒有麻煩的事件溯源事件
- 小程式–儲存圖片到相簿功能實現
- 簡單實現類似Spring的Aop原理實現Spring
- 塊儲存 檔案儲存 物件儲存物件
- 儲存—物件儲存_Minio物件
- DDD福音:Zeebe是一個類似Kafka的可擴充套件的分散式事件溯源工作流引擎Kafka套件分散式事件
- 物件儲存物件