優步Uber向Apache軟體基金會提交了一個開源大資料庫Hudi

banq發表於2019-04-23

Hudi目前管理著超過4,000個表，在Uber儲存了數PB的資料，同時將Apache Hadoop倉庫訪問延遲從幾小時降低到30分鐘以下。Hudi還以比公司以前使用的解決方案更低的成本和更高的效率為數百個增量資料流水線提供支援。
Hudi已經發展成為一個通用的大資料儲存系統，可以：

攝取和查詢引擎之間的快照隔離，包括Apache Hive，Presto和Apache Spark
支援回滾和儲存點以恢復資料集
自動管理檔案大小和佈局，以最佳化查詢效能和目錄列表
近實時提取以使用新資料提供查詢
實時和柱狀資料的非同步壓縮

快速管理和訪問數PB資料的能力對於整個資料生態系統的可擴充套件增長至關重要。儘管如此，這種對規模和速度的綜合需求並不總是自然地適合現有的批處理和流式系統架構。
Hudi於2016年以代號“Hoodie”開發，旨在解決攝取和ETL管道中的低效問題，這些管道需要Uber 大資料生態系統中的 upsert和增量消費原語。為了與更廣泛的大資料社群分享這些好處，優步於2017年開放Hudi。
展望未來，該專案將與The Apache Software Foundation共存。請檢視Apache Hudi專案頁面，瞭解技術文件和社群參與指南。

Uber基於Apache Hudi構建PB級資料湖實踐
2020-06-11
Apache
深度對比Apache CarbonData、Hudi和Open Delta三大開源資料湖方案
2020-10-29
Apache
恭喜 DevLake 加入 Apache 軟體基金會孵化器！
2022-05-23
devApache
開源資料庫大會技術分享
2021-09-09
資料庫
Linux基金會開源軟體學園技術公開課
2022-02-28
Linux
Apache ShardingSphere：由開源驅動的分散式資料庫中介軟體生態
2021-08-02
Apache分散式資料庫
祝賀姜寧連任 2023 Apache 軟體基金會董事
2023-03-10
Apache
使用PyQt開發一個資料庫管理桌面軟體
2024-06-22
QT資料庫
Apache Hudi助力nClouds加速資料交付
2020-10-23
ApacheCloud
祝賀姜寧當選 2022 Apache 軟體基金會新任董事
2022-03-04
Apache
調優 | Apache Hudi應用調優指南
2020-06-06
Apache
資料湖框架選型很糾結？一文了解Apache Hudi核心優勢
2021-01-01
框架Apache
使用Apache Spark和Apache Hudi構建分析資料湖
2020-06-15
ApacheSpark
資料湖倉比較：Apache Hudi、Delta Lake、Apache Iceberg
2022-08-22
Apache
Apache Hudi：雲資料湖解決方案
2020-06-21
Apache
使用Apache Hudi構建大規模、事務性資料湖
2020-06-27
Apache
教你一步步釋出一個開源庫到 JCenter
2018-05-06
Apache Hudi在醫療大資料中的應用
2020-05-29
Apache大資料
開源資料庫中介軟體-MyCa初探與分片實踐
2018-08-09
資料庫
大資料基礎軟體廠商請小心“開源”陷阱！
2018-05-07
大資料
用友財務軟體資料庫恢復步驟
2024-07-06
資料庫
基於Apache Hudi + MinIO 構建流式資料湖
2022-10-11
Apache
Go的又一個分散式資料庫開源了
2018-05-10
Go分散式資料庫
巨杉資料庫加入CNCF雲原生應用計算基金會，共建開源技術生態
2019-03-15
資料庫
開源資料庫商業化加速，雲端計算助推開源軟體發展
2022-01-29
資料庫
Uber將向公眾開放出行大資料：希望能更好規劃城市出行
2018-04-23
大資料
開源軟體安全任重道遠!80%的軟體程式碼庫包含至少一個漏洞
2022-04-15
Apache Hudi與Apache Flink整合
2020-10-13
Apache
開放原子開源基金會理事長楊濤出席數字中國軟體開源分論壇並演講
2021-04-29
一個好的大資料分析軟體包含哪些功能
2021-11-22
大資料
hudi clustering 資料聚集（一）
2021-11-11
教你七步優化資料庫
2018-09-28
優化資料庫
Harbor開源專案加入CNCF基金會!
2018-08-01
官宣！AWS Athena正式可查詢Apache Hudi資料集
2020-07-27
Apache
Robinhood基於Apache Hudi的下一代資料湖實踐
2022-03-31
Apache
OpenSSF 和 Linux 基金會出席白宮峰會：開源軟體供應鏈安全議題成焦點
2022-01-27
Linux
新一代開源時序資料庫TDengine有哪些優勢？
2022-09-15
資料庫
中國首個開源基金會成立，已有七個專案加入孵化
2020-09-11

優步Uber向Apache軟體基金會提交了一個開源大資料庫Hudi

相關文章