維模型的應用
--[@more@]1:確定資料範圍
確定資料範圍實際上是對ODS進行主題劃分的過程,這種劃分是基於對業務系統的基礎上而進行的,並不十分關心整個資料倉儲系統上端應用需求,但是需要把上端應用需求與ODS資料範圍進行驗證,以確保應用所需的資料都已經從業務系統中抽取出來,並且得到了很好的組織。一般來講,主題的劃分是以業務系統的資訊模型為依據的,設計者需要綜合各種業務系統的資訊模型,並進行宏觀的歸併,得到企業範圍內的高層資料檢視,並加以抽象,劃定幾個邏輯的資料主題範圍。在這個階段,以ER模型表示資料主題關係最為恰當。
2:根據資料範圍進行進一步的資料分析和主題定義
在第一步中定義出來了企業範圍內的高層資料檢視,以及所收集到的各種業務系統的資料,在這一步中,需要對大的資料主題進行分解,並進行主題定義,直到每個主題能夠直接對應一個主題資料模型為止。在這個階段,將把第一步生成的每個ER圖中的實體進行分解,分解的結果仍以ER表示為佳。
3:定義主題元素
定義維、度量、主題、粒度、儲存期限
定義維的概念特性:
維名稱,名稱應該能夠清晰表示出這個維的業務含義。
維成員,也就是這個維所代表的具體的資料,
維層次,維成員之間的隸屬與包含的層次關係,每個層次需要定義名稱
定義度量的概念特性:
度量名稱,名稱應該能夠清晰標書這個度量的業務含義
定義主題的概念特性:
主題名稱和含義,說明該主題主要包含哪些資料,用於什麼分析;
主題所包含的維和度量;
主題的事實表,以及事實表的資料。
定義粒度:
主題中事實表的資料粒度說明,這種粒度可以透過對維的層次限制加以說明,也可以透過對事實表資料的業務細節程度進行說明。
定義儲存期限:
主題中事實表中的資料儲存週期。
4:迭代,歸併維、度量的定義
在ODS中,因資料來自於多個系統,資料主題劃分時雖然對資料概念進行了一定程度上的歸併,但具體的業務程式碼所形成的各個維、以及維成員等還需要進一步進行歸併,把概念統一的維定義成一個維,不允許同一個維存在不同的實體表示(象不同的業務系統中一樣)。
5:物理實現
定義每個主題的資料抽取週期、抽取時間、抽取方式、資料介面,抽取流程和規則。
物理設計不僅僅是ODS部分的資料庫物理實現,設計資料庫引數、作業系統引數、資料儲存設計之外,有關資料抽取介面等問題必須清晰定義。
DW設計指南
確定資料範圍實際上是對ODS進行主題劃分的過程,這種劃分是基於對業務系統的基礎上而進行的,並不十分關心整個資料倉儲系統上端應用需求,但是需要把上端應用需求與ODS資料範圍進行驗證,以確保應用所需的資料都已經從業務系統中抽取出來,並且得到了很好的組織。一般來講,主題的劃分是以業務系統的資訊模型為依據的,設計者需要綜合各種業務系統的資訊模型,並進行宏觀的歸併,得到企業範圍內的高層資料檢視,並加以抽象,劃定幾個邏輯的資料主題範圍。在這個階段,以ER模型表示資料主題關係最為恰當。
2:根據資料範圍進行進一步的資料分析和主題定義
在第一步中定義出來了企業範圍內的高層資料檢視,以及所收集到的各種業務系統的資料,在這一步中,需要對大的資料主題進行分解,並進行主題定義,直到每個主題能夠直接對應一個主題資料模型為止。在這個階段,將把第一步生成的每個ER圖中的實體進行分解,分解的結果仍以ER表示為佳。
3:定義主題元素
定義維、度量、主題、粒度、儲存期限
定義維的概念特性:
維名稱,名稱應該能夠清晰表示出這個維的業務含義。
維成員,也就是這個維所代表的具體的資料,
維層次,維成員之間的隸屬與包含的層次關係,每個層次需要定義名稱
定義度量的概念特性:
度量名稱,名稱應該能夠清晰標書這個度量的業務含義
定義主題的概念特性:
主題名稱和含義,說明該主題主要包含哪些資料,用於什麼分析;
主題所包含的維和度量;
主題的事實表,以及事實表的資料。
定義粒度:
主題中事實表的資料粒度說明,這種粒度可以透過對維的層次限制加以說明,也可以透過對事實表資料的業務細節程度進行說明。
定義儲存期限:
主題中事實表中的資料儲存週期。
4:迭代,歸併維、度量的定義
在ODS中,因資料來自於多個系統,資料主題劃分時雖然對資料概念進行了一定程度上的歸併,但具體的業務程式碼所形成的各個維、以及維成員等還需要進一步進行歸併,把概念統一的維定義成一個維,不允許同一個維存在不同的實體表示(象不同的業務系統中一樣)。
5:物理實現
定義每個主題的資料抽取週期、抽取時間、抽取方式、資料介面,抽取流程和規則。
物理設計不僅僅是ODS部分的資料庫物理實現,設計資料庫引數、作業系統引數、資料儲存設計之外,有關資料抽取介面等問題必須清晰定義。
DW設計指南
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/7600305/viewspace-931818/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Laravel 模型事件的應用Laravel模型事件
- 數字孿生五維模型及十大領域應用模型
- Pix4Dmapper空間三維模型的應用例項:GIS選址分析APP模型
- 揭秘貨拉拉大模型應用平臺的應用部署大模型
- 簡單的Java二維碼應用Java
- 語言模型:GPT與HuggingFace的應用模型GPT
- 可本地執行大模型的應用大模型
- 人工智慧--運維應用人工智慧運維
- 架構師應該具備哪些思維模型?架構模型
- 大語言模型的應用探索—AI Agent初探!模型AI
- Docker 運維高階應用管理Docker運維
- 夏農的“創意思維"在程式設計的應用程式設計
- 模型思維(01)模型
- 人工智慧在IT運維中的研究和應用人工智慧運維
- Reactor執行緒模型及其在Netty中的應用React執行緒模型Netty
- 廣告流量反作弊風控中的模型應用模型
- 深度學習之卷積模型應用深度學習卷積模型
- HarmonyOS:應用程式包結構(1)Stage模型應用程式包結構模型
- 應雲而生,幽靈的威脅 - 雲原生應用交付與運維的思考運維
- 璞華AI大模型應用的探索之路:從AI大模型開發與運營平臺到應用寶庫的最佳實踐AI大模型
- AIOps在京東資料庫運維中的典型應用AI資料庫運維
- 實景三維在園區管理領域的應用
- 精益思維在焊接生產線上的應用
- c語言中二維陣列的生成及應用C語言陣列
- [分享] 一篇不錯的思維工具應用案例
- 淺析大模型在銀行業客服中心的應用大模型行業
- 公眾號渠道二維碼 / 帶引數二維碼的典型應用場景
- ollama搭建本地ai大模型並應用呼叫AI大模型
- AI大模型在醫院門診應用AI大模型
- C/C++ Qt StandardItemModel 資料模型應用C++QT模型
- 應用模型開發指南上新介紹模型
- 探究大語言模型的思維方式模型
- 工作中常用的方法(思維模型)模型
- 實景三維在園林養護管理上的應用
- 政企信創網路運維管理的創新與應用運維
- 深度學習模型在序列標註任務中的應用深度學習模型
- BERT模型在京東零售業務的應用實踐模型
- PraisonAI :簡化各種大模型應用的建立和編排AI大模型
- 基於大模型的智慧體徹底顛覆AI應用大模型智慧體AI