- 資料採集模組 主要採集什麼 業務資料和使用者行為資料 包括 頁面瀏覽記錄,啟動記錄,錯誤記錄,曝光記錄,動作記錄 格式包括頁面日誌和啟動日誌JSON格式?
- flume怎麼採集
-
第一次見沒有sink的flume
-
業務資料怎麼說?sku商品表 平臺表 流水錶 退單表 訂單詳情 優惠券表 省份表 在網上找的資料集
- 使用者行為資料怎樣由kafka匯入到hdfs flume最佳化 filechannel最佳化
- 業務資料同步才有增量和全量這個概念
而且這裡的增量同步不是新增了什麼表拿過來,業務資料庫建立時的表幾乎就是全部需要用到的表了,不需要建,將同步的資料建成原表拿過來!
- 全量表同步用datax 因為離線方式
每一張表太麻煩,看有什麼配置工具。
- 最後把每天的同步指令碼寫好 寫好指令碼後要修改配置許可權777
遺憾哪裡冒出來的kafka 不是MySQL資料庫嗎?原來MySQL要將首日表同步到kafka,需要用到Maxwell的boostrap功能 kafka是支援offset的!對於端到端的準確性非常重要!
- 建模理論
- 維度表設計 主維表和相關維表都是事實表
維度屬性就是除了主鍵之外的維度欄位 維度屬性可從主維表或者相關維表得到!
- 雪花模型和星辰模型
-
數倉分層一共有五層 我已經知道了至少四層!
-
大多數統計需求都是原子指標、派生指標、衍生指標這套模式,大多數派生指標可以複用,作為公共指標,提供效率
彙總表DWs
-
-
ODS層設計
將需要繪製的匯出到SQL ADS服務 各種面向主題的報表
3/25數倉面試總結
相關文章
- 3年PHPer的面試總結PHP面試
- 廣州,3年Web面試總結Web面試
- 【面試總結】記一次失敗的 bilibili 面試總結(3)面試
- 25個Apache面試題彙總Apache面試題
- 大資料-數倉學習總結與分享大資料
- 跳槽!3年Java面試經驗總結Java面試
- 面試總結面試
- [面試倉庫]CSS面試題彙總--佈局篇CSS面試題
- java面試總結Java面試
- 面試技巧總結面試
- 面試題總結面試題
- VUE 面試總結Vue面試
- iOS 面試總結iOS面試
- 面試總結(一)面試
- UC面試總結面試
- Servlet面試總結Servlet面試
- kafka面試總結Kafka面試
- golang 面試總結Golang面試
- sql面試總結SQL面試
- min_25篩題目總結
- 面試必刷:最有用的Mysql面試題,面試了無數公司總結的MySql面試題
- 「數倉面試」如何確定主題域?面試
- 30 天精通 RxJS (25):Subject 總結JS
- css面試題總結CSS面試題
- RunLoop總結與面試OOP面試
- nodejs面試總結NodeJS面試
- iOS 面試題總結iOS面試題
- 今日面試總結面試
- PHP面試題總結PHP面試題
- Android面試總結Android面試
- 面試問題總結面試
- Kafka面試題總結Kafka面試題
- Ajax面試題總結面試題
- 面試刷題總結面試
- 電話面試總結面試
- 面試失敗總結面試
- 前端面試總結前端面試
- 面試官的總結面試