基於Hadoop的Apache Hudi 0.10 釋出
Apache Hudi 0.10 釋出,Hadoop關聯
http://www.linuxeden.com/a/96092
使用 Apache Hudi 在 Uber 構建大規模交易資料湖:https://eng.uber.com/apache-hudi-graduation/
Apache Hudi是一個儲存抽象框架,幫助分散式組織構建和管理兆位元組規模的資料湖。Hudi使用上插入和增量拉動等原語,將流式處理引入類批處理的大資料。這些功能有助於為我們的服務顯示更快、更新鮮的資料,具有分分鐘以下資料延遲的統一服務層,避免了維護多個系統的任何額外開銷。增加了靈活性,Apache Hudi可以在Hadoop分散式檔案系統(HDFS)或雲端儲存上執行。
Hudi在資料湖上啟用原子性、一致性、隔離性和永續性(ACID)語義。Hudi使用最廣泛的兩個功能是上插入和增量拉動,這使使用者能夠吸收更改資料捕獲並將其大規模應用於資料湖。Hudi提供了廣泛的可插拔索引功能,以實現這一點,以及自己的資料索引實現。Hudi控制和管理資料湖中檔案佈局的能力不僅對克服HDFS命名節點和其他雲端儲存限制極其重要,而且對於通過提高可靠性和查詢效能來維護健康的資料生態系統也極其重要。為此,Hudi支援多個查詢引擎整合,如Presto、Apache Hive、Apache Spark和Apache Impala。
相關文章
- Apache Hudi 0.6.0版本重磅釋出Apache
- Apache Hudi 0.13.0版本重磅釋出!Apache
- Apache Hudi 0.8.0版本重磅釋出Apache
- 特性速覽| Apache Hudi 0.5.3版本正式釋出Apache
- 基於Apache Hudi + MinIO 構建流式資料湖Apache
- Apache Hadoop 3.1.0重磅釋出,終於支援GPU和FPGA了!ApacheHadoopGPUFPGA
- 基於Apache Hudi和Debezium構建CDC入湖管道Apache
- OnZoom 基於Apache Hudi的流批一體架構實踐OOMApache架構
- 基於Apache Hudi + Flink的億級資料入湖實踐Apache
- KLOOK客路旅行基於Apache Hudi的資料湖實踐Apache
- Apache Hudi Timeline:支援 ACID 事務的基礎Apache
- Uber基於Apache Hudi構建PB級資料湖實踐Apache
- 基於Apache Hudi在Google雲構建資料湖平臺ApacheGo
- Robinhood基於Apache Hudi的下一代資料湖實踐Apache
- 觸寶科技基於Apache Hudi的流批一體架構實踐Apache架構
- Apache Hudi與Apache Flink整合Apache
- 基於Apache Hudi構建資料湖的典型應用場景介紹Apache
- 基於 Apache Hudi 構建增量和無限回放事件流的 OLAP 平臺Apache事件
- Apache Hudi和Presto的前世今生ApacheREST
- Apache Hudi使用簡介Apache
- 醫療線上OLAP場景下基於Apache Hudi 模式演變的改造與應用Apache模式
- Apache Hudi:CDC的黃金搭檔Apache
- 重磅!Vertica整合Apache Hudi指南Apache
- Apache Hudi初學者指南Apache
- Apache Airflow 2.3.0 釋出ApacheAI
- Apache APISIX 2.13.0 釋出ApacheAPI
- Apache Kafka 3.0.0釋出ApacheKafka
- 基於 Redis 的訂閱與釋出Redis
- 基於Jenkins釋出微服務Jenkins微服務
- Apache hudi 核心功能點分析Apache
- Apache Hudi 與 Hive 整合手冊ApacheHive
- Apache RocketMQ + Hudi 快速構建 LakehouseApacheMQ
- 在AWS Glue中使用Apache HudiApache
- 重磅!解鎖Apache Flink讀寫Apache Hudi新姿勢Apache
- Apache Flink 1.16 正式釋出Apache
- 基於 Ubuntu 的KDE neon釋出18.04 LTSUbuntu
- 基於Nodejs的前端灰度釋出方案_20190228NodeJS前端
- CatchAdmin 釋出,基於 Element 重構