構建資料倉儲
總結:個人資料倉儲建設經驗 2009-10-12 至2009-10-28 整理中....
以資料質量為保證,後設資料為導向,資料建模為基礎講訴資料倉儲的構建....
[@more@]1、資料質量。資料分析與預測的前提是較高的資料質量。此專案也得到較多建設資料倉儲人士的認可與重視。但是一般專案都沒有做好此內容。個人認為還沒有建立完善的資料質量模型上面。下面會針對後設資料,資料建模一起講訴如何來構建完善資料質量系統。
2、後設資料。後設資料是體現資料倉儲資料的資料。後設資料管理系統是管理資料倉儲資料的系統。包括資料倉儲資料演算法,資料邏輯等,同時後設資料系統也為資料質量提供很好資料基礎。
3、資料建模。所以應用都是在資料模型的基礎上。一個模型的好壞,不僅對應用起很大影響作用,同時對資料質量構建也起很大的作用。
如何構建快捷,高效的資料質量系統。
a)統一業務應用。資料建模主要體現在:同一應用,在模型上一致。如:指標A1,物理模型為CA1,那麼只要與指標A1相關的指標都包含A1資訊,如:最大的指標A1,物理模型設定為:MAX_CA1;指標A1平均,物理模型設定為:AVG_CA1。而不同的粒度,出現相同的A1,都統一定義為CA1。只統一定義之後,我們才能迅速地地位指標內容,從而提高資料質量。如:資料一致校驗。i)快速檢查出與CA1相關的模型。SELECT TABLE_NAME FROM ALL_TAB_COLUMNS WHERE COLUMN_NAME LIKE '%CA1%';ii)快速地完成各個模型之間資料對比,從而較快地提高資料質量。這一項,對資料質量十分有用。同時對後設資料的管理,也起很大作用,即業務一致與模型的一致性。
b)資料質量優於業務應用。很多資料倉儲的應用都是先完成業務應用開發,再進行資料質量建設。這有點本末倒置。就象先有開發後有測試的模式。本人建議,採用資料質量驅動業務應用開發的模式,即現在所謂的測試驅動開發的模式。現在資料倉儲系統都建立在運營系統之上。有運營系統一定就會業務統計資料,資料質量模型可以依賴於這些原先業務統計資料,建立資料質量測試模型。資料倉儲資料質量要以透過此測試模型為前提。但是很多資料倉儲都沒有建立這樣資料質量測試模型。以至浪費很多時間,發現極差的資料質量,最後還得都進行資料質量建設。說到底,資料質量測試模型的建議是不可避免的。只是我把向前建設。但是這一向前建設,對提高資料質量,專案進度開發是起了很大的作用。不可小看它的作用。
。。。。。。。。。。。。。待續
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/22630256/viewspace-1027635/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 如何構建資料倉儲模型?模型
- Hive:資料倉儲構建步驟Hive
- 構建實時資料倉儲首選,雲原生資料倉儲AnalyticDB for MySQL技術解密MySql解密
- 使用Power BI構建資料倉儲與BI方案
- 《Greenplum構建實時資料倉儲實踐》簡介
- HashData完成1500萬美元融資 加速構建雲原生資料倉儲
- 資料湖+資料倉儲 = 資料湖庫架構架構
- 基於OneData的資料倉儲建設
- 企業為什麼要建資料倉儲?
- 資料倉儲架構分層設計架構
- 最最最全資料倉儲建設指南,速速收藏!!
- 中小銀行資料倉儲建設 | 最佳實踐
- 資料庫倉庫系列:(一)什麼是資料倉儲,為什麼要資料倉儲資料庫
- 資料倉儲(5)數倉Kimball與Inmon架構的對比架構
- 雲端資料倉儲的模式選型與建設模式
- 滴滴資料倉儲指標體系建設實踐指標
- 加快構建資料倉儲 甘肅銀行數字化轉型提速推進
- 資料倉儲 - ER模型模型
- [數倉]資料倉儲設計方案
- TDS 四大能力域各顯神通,構建資料湖、資料倉儲一步到位
- 分層架構在資料倉儲的應用架構
- 資料湖 VS 資料倉儲之爭?阿里提出大資料架構新概念:湖倉一體阿里大資料架構
- 為什麼要建資料倉儲,而不是直連資料來源?
- 資料倉儲應該用什麼方案——資料倉儲實施方案概述
- 什麼是資料倉儲
- 什麼是資料倉儲?
- 資料倉儲經驗概念
- 資料倉儲建模方法論
- 淺談資料倉儲和大資料大資料
- 資料湖會取代資料倉儲嗎?
- 談談資料湖和資料倉儲
- 美團DB資料同步到資料倉儲的架構與實踐架構
- 阿里雲“萬倉計劃”重磅釋出,助力每個企業構建屬於自己的雲原生資料倉儲阿里
- 資料倉儲Build The Data Warehouse(William H.Inmon)學習筆記 --- 第八章、外部資料/非結構化資料與資料倉儲UI筆記
- 資料湖 vs 資料倉儲 vs 資料庫資料庫
- 資料倉儲(6)數倉分層設計
- 資料倉儲(7)數倉規範設計
- 資料倉儲基礎介紹
- ETL資料倉儲的使用方式