「數倉面試」如何確定主題域?
大家好,我是一哥,前幾天跟一個朋友聊了一些資料中臺建設的內容,針對資料倉儲中主題域如何劃分這個話題聊了很多。其實資料倉儲建設的理論大家已經都知道了不少,也看過不少書,那麼在實際建設資料倉儲中,我們還是會遇到各種問題。
前段時間招人,面試了幾個簡歷上都寫了有3年以上數倉開發的,當我問他“如何確定主題域?”,他卻說“我來公司的時候已經都搞好了……”,再問他“如果進入一個新領域,從0到1搭建數倉,怎麼確定主題域呢?” 他就蒙了……
今天一哥帶你一起聊聊主題域如何劃分?
01、什麼是主題
主題是在較高層次上將企業資訊系統中的資料進行綜合、歸類和分析利用的一個抽象概念,每一個主題基本對應一個宏觀的分析領域。在邏輯意義上,它是對應企業中某一宏觀分析領域所涉及的分析物件。
簡單說,一個主題對應一個分析物件。分析物件就是在決策、分析時重點關注的東西,這個東西其實是非常主觀的,在不同的企業,或者企業的不同發展時期,所關注的點會不一樣,從而影響有些主題可能存在或者不存在。
資料倉儲是面向主題的應用,主要功能是將資料綜合、歸類並進行分析利用。資料倉儲模型設計除橫向的分層外,通常還需要根據業務情況縱向劃分主題域。主題域是業務物件高度概括的概念層次歸類,目的是便於資料的管理和應用。
02、如何劃分主題
劃分主題域方法
在業務調研之後,可以進行主題域的劃分。劃分主題域,需要分析各個業務模組中有哪些業務活動。通常我們按照以下方法劃分主題域,可以按照使用者企業的部門劃分,也可以按照業務過程或者業務板塊中的功能模組劃分。
按照系統劃分:業務系統有幾種,就劃分為幾類
-
按業務過程劃分:比如業務系統中有商品、交易、物流等
-
按部門規劃:比如公司內的生產、供應鏈、研發、銷售等
目前有些成熟的行業,比如電信、銀行,他們也是最早用資料倉儲的行業,已經形成了一些規範,可以直接按照規範來就行了。其中IBM金融資料模型資料儲存模型FSDM,是金融行業應用極為廣泛的資料模型,可以作為我們構建企業級資料倉儲主題域模型劃分的重要依據。
對於新興的一些行業,或者業內沒有形成標準的話,那麼就可以參照上面的幾類方法,進行分類,先從邊界清晰的系統入手進行建設,形成經驗後逐步推到各個系統中。
個人比較推薦透過業務系統來進行一級主題域劃分,這樣邊界就會很明顯,資料倉儲開發過程中不會因為模型主題的歸屬“扯皮”,然後根據各個系統中的業務過程劃分二級主題域目前我參與過的兩個資料倉儲建設專案也都是這樣搞的。
主題域的核心
為保障整個體系的生命力,主題域需要抽象提煉,並長期維護更新,但不輕易變動。劃分資料域時,需滿足以下兩點:
能涵蓋當前所有的業務需求。
能在新業務進入時,無影響地被包含進已有的主題域中和擴充套件新的主題域。
一次能劃分好主題域嗎
首先,主題域是無法一次劃分完整的,一般是一次先建立幾個明確的主題,在大多數資料倉儲的設計過程中都有一個主題域的選擇過程。業務是一直髮展的,因此設計之初不要想著一次把所有主題全部劃分完整。我們可以遵循上面說的劃分主題域的兩個要點,後續採用迭代的方式補充。
03、總結
資料倉儲建設是一套方法論,但並不是一個“定理”,可能不會有完全符合你實際公司業務的“公式”,我們需要學習這些方法論,然後結合自己公司實際的業務場景來實現,只要能有序的把資料管控起來,同時又能高效的幫助資料分析,實現業務價值就好了,不必一味的追求“行業標準”。
來自 “ 資料社 ”, 原文作者:資料一哥;原文連結:https://mp.weixin.qq.com/s/KBWOsZOZKuDhDPs4fuhOdw,如有侵權,請聯絡管理員刪除。
相關文章
- 資料倉儲主題域如何劃分
- 大資料數倉高階面試題整理《一》大資料面試題
- 效能測試中如何確定TPS和併發數
- 3/25數倉面試總結面試
- [面試倉庫]CSS面試題彙總--佈局篇CSS面試題
- 效能測試中如何確定併發使用者數
- 方法的定義面試題面試題
- JavaScript作用域面試題避坑指南JavaScript面試題
- 二十五個軟體測試經典面試題,你確定不收藏一波?面試題
- 面試題:布林變數面試題變數
- GitHub 主題又多了一個 —— 新的 Dimmed Dark 主題以及設定頁面!Github
- ETL數倉測試
- 淺談如何確定伺服器的數量伺服器
- 高頻面試:如何解決MySQL主從複製延時問題面試MySql
- Java面試官:兄弟,你確定double精度比float低嗎?Java面試
- 面試題:如何理解閉包面試題
- 面試題:教你如何吃透RocketMQ面試題MQ
- LeetCode 面試題16.07[最大數值]LeetCode面試題
- OTDR光時域反射儀測試引數設定反射
- HTML最新面試題(筆試面試題)HTML面試題筆試
- 面試官:你確定 Redis 是單執行緒的程式嗎?面試Redis執行緒
- 離線數倉測試
- 十三、確定測試資源
- 一篇搞定面試中的跨域問題面試跨域
- 如何確定Kafka的分割槽數、key和consumer執行緒數Kafka執行緒
- 面試題:面試經面試題
- 為Spring Boot面試準備13個主題 - javinpaulSpring Boot面試
- 如何更好的回答面試問題面試
- 面試題 17.04. 消失的數字面試題
- 如何確定Single-Primary模式下的MGR主節點(文件 ID 2214438.1)模式
- 【Redis面試題】如何使用Redis實現微信步數排行榜?Redis面試題
- 面試必刷:最有用的Mysql面試題,面試了無數公司總結的MySql面試題
- 數字營銷(二)如何確定付費客戶特徵?特徵
- 【程式設計師面試寶典】確定兩串亂序同構程式設計師面試
- 「面試題」20+Vue面試題整理面試題Vue
- 再談JavaScript作用域——你確定你真的知道?JavaScript
- 大資料面試SQL每日一題系列:最高峰同時線上主播人數。位元組,快手等大廠高頻面試題大資料SQL每日一題面試題
- win10如何自定義主題_win10怎麼設定自定義主題Win10