《Greenplum構建實時資料倉儲實踐》簡介

brucexia發表於2022-08-03

# 好書推薦 ## 好書奇遇季 # Greenplum 構建實時資料倉儲實踐》,京東噹噹天貓都有發售。定價 89 元,網店打折銷售其實沒多少錢。

Greenplum 分散式資料庫具有可選儲存模式、事務支援、並行查詢與資料裝載、容錯與故障轉移、資料庫統計、過程化語言擴充套件等方面的功能特性,因此 Greenplum 成為一款理想的分析型資料庫產品。本書詳解 Greenplum 資料倉儲構建與資料分析技術,配套示例原始碼。

 

本書內容

 

本書共分 10 章。內容包括資料倉儲簡介、資料倉儲設計基礎、 Greenplum 與資料倉儲、 Greenplum 安裝部署、實時資料同步、實時資料裝載、維度表技術、事實表技術、 Greenplum 運維與監控、整合機器學習庫 MADlib

 

本書涉及的具體技術

 

1 MySQL 主從複製,保證為業務系統提供可靠的資料庫服務,並提供資料來源。

2 Canal Server 實時獲取增量 MySQL binlog ,並將其傳入 Kafka 訊息佇列。

3 Kafka 將訊息持久化,同時提供可伸縮、高吞吐的訊息服務。

4 Canal ClientAdapter 負責消費 Kafka 中的訊息,將資料流傳輸到 Greenplum

5 Greenplum 提供實時 ETL 功能,自動維護運算元據儲存、維度表與事實表。

6 Greenplum 資料庫許可權與角色管理、資料匯入匯出、效能最佳化、監控與維護。

7 Greenplum 整合機器學習庫 MADlib ,對資料進行分析與挖掘。

 

本書讀者

 

本書適合 Greenplum 初學者、大資料分析系統設計與開發、資料倉儲系統設計與開發、 DBA 、架構師等相關技術人員閱讀,也適合高等院校大資料相關專業的師生作為實訓教材。

 

本書作者

 

王雪迎 ,畢業於中國地質大學計算機專業,高階工程師, 20 年資料庫、資料倉儲相關技術工作經驗。先後供職於北京現代商業資訊科技有限公司、北京線上九州資訊科技服務有限公司、華北計算技術研究所、北京優貝線上網路科技有限公司,擔任 DBA 、資料架構師等職位。著有圖書《 Greenplum 構建實時資料倉儲實踐》《 Kettle 構建 Hadoop ETL 系統實踐》《 Hadoop 構建資料倉儲實踐》《 HAWQ 資料倉儲與資料探勘實戰》《 SQL 機器學習庫 MADlib 技術解析》《 MySQL 高可用實踐》。

 

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/18841117/viewspace-2908771/,如需轉載,請註明出處,否則將追究法律責任。

相關文章