資料倉儲指南 (轉)

worldblog發表於2007-12-09
資料倉儲指南 (轉)[@more@] 

資料倉儲學習心得:namespace prefix = o ns = "urn:schemas--com::office" />

一.概念

1.資料倉儲:是指面向主題的,一致的,不同時間的,穩定的資料集合,用於支援經營管理中的決策支援過程。從廣義上講資料倉儲是指大量歷史資料的。每一個記錄代表特殊時間點上的一個資料。

它是一種把收集的各種資料轉變成有商業價值的資訊科技,並把收集的資訊體現在報告中。包括收集資料,過濾資料,儲存資料,之後把資料應用於分析、報告等應用。

2.資料倉儲目標:確認資料結構,尋找趨勢,輔助決策,為經營管理提供決策資訊。

3..DSS:決策支援過程。

4.資料倉儲組成部分:資料市場,關係型資料庫,資料來源,資料準備,種服務工具

5.維度:

6.多維:

7.聚合:獲取並集中一個群體或總和的結構.聚合是在一個多維層次內移動資料的概念.

9.類別:為類別和區分特定資料而分類的,在一個維度內,為提供詳細分類而定義的分類.

10.詳細類別:一個維度內最底層的分類.

11.分解與合成:

12.指標量:

13.OLAP:聯機分析

14.OLTP聯機事務處理

二.資料模型規範化

1.  概念:

規範化:是一個正規的方法,它應用一套規則使屬性和實體相關聯。

實體:是一個主要的資料,對至關重要。它通常是將被記錄在資料庫中的一個人、一個地點、一樣東西或者一件事情。
屬性:實體包括屬性,屬性就是特徵,修飾成分、質量、數量或者特性。

正規化:規範化由幾個能夠減少褓以獲得更滿意的物理我的步驟組成,這些步驟稱為正規化。

第一正規化:一個不包含重複列的表歸於第一正規化。

第二正規化:如果一個表歸於第一正規化且只包含依賴於主鍵的列,則歸於第二正規化。

第三正規化:如果一個表歸於第二正規化且只包含那些非傳遞性地依賴於主鍵的列,則歸於第三正規化。

二.資訊需求建模:

1.自上而下建模方法:利用具體資料元素,將這些元素組織到各個維度與指標中,

2.自下而上建模方法:從使用者的觀點設計,優點是設計者可以轉紙一個通常主題或商務領域運

3.開發. 是自上而下與自下而上的方法的結合.

4.舉例:銷售收入應從預算和實際等角度表示.

指標:產品銷售的實際收入,產品銷售的預算收,產品銷售的估計收

維度:已經銷售的產品.

三.設計資料倉儲,經常詢部使用者的幾個問題?

1.使用者所在部門承擔的任務

2.使用者在部門中承擔的任務

3.為完成任務,使用者需哪些報表

4.目前從何處獲取這些資訊?

5.得到資訊如何處理?

6.資訊是應使用者需要產生的,還是在定期報表中產生的?

7.使用者把資訊輸入到過工作表中嗎?以便進一步分析嗎?

8.怎樣處理這些資訊才算及時?

資訊包的編制:

 

  資訊包:________________________

  維度:____________________________________________

 類別:

  指標(預測銷售,實際銷售,預測偏差)

 

 


 

 

    

 

 

 

四.建立多維資料模型

要建立多維資料庫:

1.  選擇用來分析被建模主題的商業過程。

建模主題:比如想透過產品線和地區分析消費者的購買傾向來制訂市場策略,此時資料模型主題就是“銷售”。

2.  確定事實表的粒度。

事實表粒度通常代表每一個相關維的最底層。選擇以“天”為粒度,就表示“時間維”中的每一記錄代表一天。

3.  區分每一個事實表的維和層。

已定義的粒度與維相關。

4.  區分事實表的度量。

度量不僅包括資料本身,而且包括你從已存在的資料計算得到的新值。當設計資料模型時,必須做出決策:是否儲存事實表裡的計算結果或在執行階段獲得這些值。如:比值。

5.  確定每一個維表的屬性。

一般情況下,定義的每一個維表屬性的數量,應該保持最小。

6.  讓使用者驗證資料模型。

 歡迎您給我發E  , 讓我們共同進步。

   

 


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/10752043/viewspace-990283/,如需轉載,請註明出處,否則將追究法律責任。

相關文章