【新年新姿勢第一彈】騰訊雲EMR數倉建設教程釋出——與尚矽谷強強聯手帶你全方位瞭解大資料元件

騰訊雲開發者發表於2023-01-13

前幾天把跨年搞的和人生分水嶺似的

那麼,2023年的你有什麼不一樣了嗎?

是不是還和去年一樣的造型?新姿勢,學起來!

騰訊雲開發者社群帶著乾貨來了,騰訊雲×尚矽谷大資料研究院強強聯手,重磅推出新年第一彈:

騰訊雲EMR數倉教程釋出

騰訊雲開發者社群“公開課”直達:

騰訊雲開發者公開課 - 騰訊雲開發者社群-騰訊雲

這套教程由騰訊雲官方與尚矽谷大資料研究院聯合推出,分為實時及離線兩部分。

實時數倉依託國內電商巨頭的真實業務場景,基於各大網際網路企業對於騰訊雲EMR架構體系的需求,將整個電商的實時資料倉儲體系搭建在騰訊雲架構上。教程全方面完成了整個實時資料倉儲架構的海量資料採集、儲存、計算以及視覺化展示,整個業務流程全部搭建在騰訊雲伺服器上,並全部採用騰訊雲EMR的服務元件,將各EMR服務元件進行充分聯動。

離線數倉則基於騰訊雲EMR平臺打通資料採集通道,從數倉建模到逐層構建離線數倉,擁有完整的數倉建模理論及建模過程,且在構建過程中採用了EMR平臺元件和原生元件相結合的方式,讓企業在元件選擇上更加靈活。

專案文件按照出書標準編寫,詳細講解一行一行手敲程式碼,內容全面且細緻,教程附贈全套影片、文件、程式碼、資料。透過本套教程的學習,你可以全方位掌握騰訊雲的大資料服務元件使用和調優!

【教程簡介】

實時數倉課程介紹

離線數倉課程介紹

在“騰訊雲開發者”公眾號傳送“數倉建設” 或掃碼加入“騰訊雲大資料EMR交流群”免費獲取全套教程,群內提供騰訊雲官方大資料團隊導師全程指導及技術交流
image.png

【教程目錄】

實時數倉:

001.騰訊雲EMR實時數倉教程簡介

002.需求及架構-簡介

003.需求及架構-課程目標

004.需求及架構-資料倉儲概念

005.需求及架構-專案需求

006.需求及架構-技術選型

007.需求及架構-資料流程設計

008.需求及架構-框架的版本選型

009.需求及架構-伺服器選型

010.需求及架構-叢集規模及叢集規劃

011.需求及架構-電商業務簡介

012.需求及架構-EMR的購買與啟動

013.需求及架構-EMR叢集簡單說明

014.需求及架構-使用XShell連線服務

015.需求及架構-修改主機對映&配置無密登入

016.需求及架構-電商業務資料說明

017.需求及架構-上傳資料包

018.需求及架構-MySQL的安裝與啟動

019.需求及架構-MySQL修改密碼&遠端訪問

020.需求及架構-生成業務資料

021.需求及架構-Kafka安裝

022.需求及架構-Kafka配置環境變數&群起

023.需求及架構-同步策略&開啟MySQL Binlog

024.需求及架構-Flink安裝

025.需求及架構-專案構建

026.需求及架構-FlinkCDC程式碼講解&本地測試

027.需求及架構-FlinkCDC程式碼遠端測試

028.實時數倉搭建-課程介紹

029.實時數倉搭建-分層框架-ODS&DIM層

030.實時數倉搭建-DWD&DWS&ADS層

031.實時數倉搭建-架構分析

032.實時數倉搭建-準備工作

033.實時數倉搭建-具體工作

034.實時數倉搭建-HBase部署

035.實時數倉搭建-HBase啟動&測試

036.實時數倉搭建-IDEA程式碼環境說明

037.實時數倉搭建-Phoenix部署

038.實時數倉搭建-Phoenix啟動

039.實時數倉搭建-Redis部署

040.實時數倉搭建-Redis啟動&測試

041.實時數倉搭建-ClickHouse安裝&啟動&測試

042.實時數倉搭建-課程說明

043.實時數倉搭建-DIM層-思路分析 1

044.實時數倉搭建-DIM層-思路分析 2

045.實時數倉搭建-DIM層-思路分析 3

046.實時數倉搭建-DIM層-思路整理

047.實時數倉搭建-DIM層-消費&過濾&轉換資料

048.實時數倉搭建-DIM層-配置資訊表

049.實時數倉搭建-DIM層-讀取配置資訊&處理成廣播流

050.實時數倉搭建-DIM層-處理連線流-思路分析

051.實時數倉搭建-DIM層-處理連線流-廣播流-解析資料

052.實時數倉搭建-DIM層-處理連線流-廣播流-校驗並建表

053.實時數倉搭建-DIM層-處理連線流-廣播流-寫入狀態

054.實時數倉搭建-DIM層-處理連線流-主流-讀取狀態&過濾資料

055.實時數倉搭建-DIM層-處理連線流-主流-補充欄位並寫出資料

056.實時數倉搭建-DIM層-將資料寫出到Phoenix-編碼

057.實時數倉搭建-DIM層-將資料寫出到Phoenix-測試

058.實時數倉搭建-DIM層-將資料寫出到Phoenix-打包上傳叢集

059.實時數倉搭建-DWD層-使用者域使用者註冊程式碼講解

060.實時數倉搭建-DWD層-前置知識-WindowJOIN-說明

061.實時數倉搭建-DWD層-前置知識-IntervalJOIN-說明

062.實時數倉搭建-DWD層-前置知識-IntervalJOIN-編碼

063.實時數倉搭建-DWD層-前置知識-IntervalJOIN-測試

064.實時數倉搭建-DWD層-交易域加購事實表

065.實時數倉搭建-DWD層-工具域領券事實表

066.實時數倉搭建-DWD層-互動域評價事實表

067.實時數倉搭建-DWD層-交易域訂單事實表

068.實時數倉搭建-DWS層-整體介紹

069.實時數倉搭建-DWS層-使用者域使用者註冊基礎程式碼

070.實時數倉搭建-DWS層-ClickHouse工具類 1

071.實時數倉搭建-DWS層-ClickHouse工具類 2

072.實時數倉搭建-DWS層-ClickHouse工具類 3

073.實時數倉搭建-DWS層-交易域加購需求基礎程式碼

074.實時數倉搭建-DWS層-交易域SKU粒度下單需求前置說明

075.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-需求分析 1

076.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-需求分析 2

077.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-思路整理

078.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-JavaBean封裝

079.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-讀取&轉換&過濾&分組資料

080.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-left join重複資料去重

081.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-分組&開窗&聚合

082.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-中間測試

083.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-關聯維表說明

084.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-JDBCUtil封裝 1

085.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-JDBCUtil封裝 2

086.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-JDBCUtil測試&再封裝

087.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-關聯維表-最佳化的必要性

088.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-關聯維表-旁路快取-說明

089.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-關聯維表-旁路快取-讀寫編碼

090.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-關聯維表-旁路快取-讀寫測試

091.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-關聯維表-旁路快取-刪除快取資料

092.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-關聯維表-旁路快取-刪除快取資料 測試

093.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-關聯維表-非同步IO-說明

094.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-關聯維表-非同步IO-API說明

095.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-關聯維表-非同步IO-執行緒池工具類

096.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-關聯維表-非同步IO-非同步函式 1

097.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-關聯維表-非同步IO-非同步函式 2

098.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-關聯維表-非同步IO-非同步函式 3

099.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-關聯維表-非同步IO-非同步函式 4

100.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-完整測試

101.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-關聯維表-測試準備工作

102.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-關聯維表-測試完成

103.實時數倉搭建-DWS層-交易域-SKU粒度下單需求-關聯其他維表&寫出資料

104.實時數倉搭建-視覺化展示-課程介紹

105.實時數倉搭建-視覺化展示-任務介紹

106.實時數倉搭建-視覺化展示-Sugar基本介紹

107.實時數倉搭建-視覺化展示-Web專案基本說明

108.實時數倉搭建-視覺化展示-構建SpringBoot Web模組

109.實時數倉搭建-視覺化展示-初體驗SpringBoot Web模組

110.實時數倉搭建-視覺化展示-再體驗SpringBoot Web模組

111.實時數倉搭建-視覺化展示-GMV需求-Mapper完成

112.實時數倉搭建-視覺化展示-GMV需求-Service完成

113.實時數倉搭建-視覺化展示-GMV需求-Controllrt完成

114.實時數倉搭建-視覺化展示-GMV需求-介面測試完成

115.實時數倉搭建-視覺化展示-GMV需求-對接Sugar測試完成

離線數倉:

01.騰訊雲EMR離線數倉教程簡介

02.採集模組介紹

03.課程目標

04.資料倉儲概念

05.專案需求

06.技術選型

07.資料流程設計

08.框架版本選型

09.伺服器選型

10.叢集規模&規劃

11.電商業務簡介

12.選購EMR叢集

13.遠端連線

14.修改主機名

15.配置主機對映

16.配置免密登入

17.電商業務資料分析

18.上傳資料包

19.MySQL安裝與啟動

20.遠端連線MySQL&建庫建表

21.業務資料生成

22.Kafka服務安裝

23.Kafka服務群起&測試

24.Flume&同步策略和工具概述

25.開啟MySQL Binlog 配置資訊

26.開啟MySQL Binlog 測試

27.使用Sqoop完成全量資料同步

28.增量資料同步資料通道

29.Flink部署

30.FlinkCDC簡單程式碼說明

31.FlinkCDC簡單程式碼本地測試

32.FlinkCDC完整程式碼說明

33.FlinkCDC完整程式碼打包測試

34.Flume配置檔案

35.增量資料同步測試

36.Flume指令碼完成

37.構建離線數倉文件說明

38.資料倉儲概述

39.建模準備工作

40.建模具體工作

41.Hive環境準備-修改配置

42.Hive環境準備-測試

43.Yarn環境準備

44.開發環境準備說明

45.ODS層-建表

46.ODS層-裝載資料

47.DIM層-商品維度表

48.DIM層-優惠券維度表

49.DIM層-活動維度表

50.DIM層-地區維度表

51.DIM層-使用者維度表

52.DWD層-加購事實表

53.DWD層-下單事實表

54.DWD層-取消訂單事實表

55.DWD層-其他事實表&指令碼封裝

56.DWD層-資料展示

57.DWS層-交易域使用者商品粒度訂單需求-需求分析

58.DWS層-交易域使用者商品粒度訂單需求-建表&裝載資料

59.DWS層-交易域使用者商品粒度退單需求-建表&裝載資料

60.ADS層-品牌訂單統計

61.ADS層-交易綜合統計

62.資料視覺化-建表&匯出資料

63.資料視覺化-最終總結

掃碼或猛擊原文

相關文章