資料倉儲一般模式分析
傳統的關聯式資料庫一般採用二維數表的形式來表示資料,一個維是行,另一個維是列,行和列的交叉處就是資料元素。關係資料的基礎是關聯式資料庫模型,通過標準的SQL語言來加以實現。
資料倉儲是多維資料庫,它擴充套件了關聯式資料庫模型,以星形架構為主要結構方式的,並在它的基礎上,擴充套件出理論雪花形架構和資料星座等方式,但不管是哪一種架構,維度表、事實表和事實表中的量度都是必不可少的組成要素。
維度:是多維資料集的結構性特性。它們是事實資料表中用來描述資料的分類的有組織層次結構(級別)。這些分類和級別分別描述了一些相似的成員集合,使用者將基於這些成員集合進行分析。
度量值:在多維資料集中,度量值是一組值,這些值基於多維資料集的事實資料表中的一列,而且通常為數字。此外,度量值是所分析的多維資料集的中心值。即, 度量值是終端使用者瀏覽多維資料集時重點檢視的數字資料(如銷售、毛利、成本)。所選擇的度量值取決於終端使用者所請求的資訊型別。一些常見的度量值有 sales、cost、expenditures和production count等
事實表是資料聚合後依據某個維度生成的結果表。
1) 星型模型
星形模型是最常用的資料倉儲設計結構的實現模式,它使資料倉儲形成了一個整合系統,為終端使用者提供報表服務,為使用者提供分析服務物件。星形模式通過使用一 個包含主題的事實表和多個包含事實的非正規化描述的維度表來支援各種決策查詢。星形模型可以採用關係型資料庫結構,模型的核心是事實表,圍繞事實表的是維 度表。通過事實表將各種不同的維度表連線起來,各個維度表都連線到中央事實表。維度表中的物件通過事實表與另一維度表中的物件相關聯這樣就能建立各個維度 表物件之間的聯絡。每一個維度表通過一個主鍵與事實表進行連線。
事實表主要包含了描述特定商業事件的資料,即某些特定商業事件的度量值。一般情況下,事實表中的資料不允許修改,新的資料只是簡單地新增進事實表中,維度 表主要包含了儲存在事實表中資料的特徵資料。每一個維度表利用維度關鍵字通過事實表中的外來鍵約束於事實表中的某一行,實現與事實表的關聯,這就要求事實表 中的外來鍵不能為空,這與一般資料庫中外來鍵允許為空是不同的。這種結構使使用者能夠很容易地從維度表中的資料分析開始,獲得維度關鍵字,以便連線到中心的事實 表,進行查詢,這樣就可以減少在事實表中掃描的資料量,以提高查詢效能。
使用星形模式主要有兩方面的原因:提高查詢的效率。採用星形模式設計的資料倉儲的優點是由於資料的組織已經過預處理,主要資料都在龐大的事實表中,所以只 要掃描事實表就可以進行查詢,而不必把多個龐大的表聯接起來,查詢訪問效率較高,同時由於維表一般都很小,甚至可以放在快取記憶體中,與事實表進行連線時其 速度較快,便於使用者理解;對於非計算機專業的使用者而言,星形模式比較直觀,通過分析星形模式,很容易組合出各種查詢。
2) 雪花模型
雪花模型是對星形模型的擴充套件,每一個維度都可以向外連線多個詳細類別表。在這種模式中,維度表除了具有星形模型中維度表的功能外,還連線對事實表進行詳細描述的詳細類別表,詳細類別表通過對事實表在有關維上的詳細描述達到了縮小事實表和提高查詢效率的目的。
雪花模型對星形模型的維度表進一步標準化,對星形模型中的維度表進行了規範化處理。雪花模型的維度表中儲存了正規化的資料,這種結構通過把多個較小的標準 化表(而不是星形模型中的大的非標準化表)聯合在一起來改善查詢效能。由於採取了標準化及維的低粒度,雪花模型提高了資料倉儲應用的靈活性。
這些連線需要花費相當多的時間。一般來說,一個雪花形圖表要比一個星形圖表效率低。
3) 星座模式
一個複雜的商業智慧應用往往會在資料倉儲中存放多個事實表,這時就會出現多個事實表共享某一個或多個維表的情況,這就是事實星座,也稱為星系模式(galaxy schema)。
4) 資料集市
資料集市是在構建資料倉儲的時候經常用到的一個詞彙。如果說資料倉儲是企業範圍的,收集的是關於整個組織的主題,如顧客、商品、銷售、資產和人員等方面的 資訊,那麼資料集市則是包含企業範圍資料的一個子集,例如只包含銷售主題的資訊,這樣資料集市只對特定的使用者是有用的,其範圍限於選定的主題。
資料集市面向企業中的某個部門(或某個主題)是從資料倉儲中劃分出來的,這種劃分可以是邏輯上的,也可以是物理上的。
資料倉儲中存放了企業的整體資訊,而資料集市只存放了某個主題需要的資訊,其目的是減少資料處理量,使資訊的利用更加快捷和靈活。
資料倉儲由於是企業範圍的,能對多個相關的主題建模,所以在設計其資料構成時一般採用星系模式。
轉載:http://hi.baidu.com/mitee/blog/item/f85525f34464955c342acc21.html
資料倉儲是多維資料庫,它擴充套件了關聯式資料庫模型,以星形架構為主要結構方式的,並在它的基礎上,擴充套件出理論雪花形架構和資料星座等方式,但不管是哪一種架構,維度表、事實表和事實表中的量度都是必不可少的組成要素。
維度:是多維資料集的結構性特性。它們是事實資料表中用來描述資料的分類的有組織層次結構(級別)。這些分類和級別分別描述了一些相似的成員集合,使用者將基於這些成員集合進行分析。
度量值:在多維資料集中,度量值是一組值,這些值基於多維資料集的事實資料表中的一列,而且通常為數字。此外,度量值是所分析的多維資料集的中心值。即, 度量值是終端使用者瀏覽多維資料集時重點檢視的數字資料(如銷售、毛利、成本)。所選擇的度量值取決於終端使用者所請求的資訊型別。一些常見的度量值有 sales、cost、expenditures和production count等
事實表是資料聚合後依據某個維度生成的結果表。
1) 星型模型
星形模型是最常用的資料倉儲設計結構的實現模式,它使資料倉儲形成了一個整合系統,為終端使用者提供報表服務,為使用者提供分析服務物件。星形模式通過使用一 個包含主題的事實表和多個包含事實的非正規化描述的維度表來支援各種決策查詢。星形模型可以採用關係型資料庫結構,模型的核心是事實表,圍繞事實表的是維 度表。通過事實表將各種不同的維度表連線起來,各個維度表都連線到中央事實表。維度表中的物件通過事實表與另一維度表中的物件相關聯這樣就能建立各個維度 表物件之間的聯絡。每一個維度表通過一個主鍵與事實表進行連線。
事實表主要包含了描述特定商業事件的資料,即某些特定商業事件的度量值。一般情況下,事實表中的資料不允許修改,新的資料只是簡單地新增進事實表中,維度 表主要包含了儲存在事實表中資料的特徵資料。每一個維度表利用維度關鍵字通過事實表中的外來鍵約束於事實表中的某一行,實現與事實表的關聯,這就要求事實表 中的外來鍵不能為空,這與一般資料庫中外來鍵允許為空是不同的。這種結構使使用者能夠很容易地從維度表中的資料分析開始,獲得維度關鍵字,以便連線到中心的事實 表,進行查詢,這樣就可以減少在事實表中掃描的資料量,以提高查詢效能。
使用星形模式主要有兩方面的原因:提高查詢的效率。採用星形模式設計的資料倉儲的優點是由於資料的組織已經過預處理,主要資料都在龐大的事實表中,所以只 要掃描事實表就可以進行查詢,而不必把多個龐大的表聯接起來,查詢訪問效率較高,同時由於維表一般都很小,甚至可以放在快取記憶體中,與事實表進行連線時其 速度較快,便於使用者理解;對於非計算機專業的使用者而言,星形模式比較直觀,通過分析星形模式,很容易組合出各種查詢。
2) 雪花模型
雪花模型是對星形模型的擴充套件,每一個維度都可以向外連線多個詳細類別表。在這種模式中,維度表除了具有星形模型中維度表的功能外,還連線對事實表進行詳細描述的詳細類別表,詳細類別表通過對事實表在有關維上的詳細描述達到了縮小事實表和提高查詢效率的目的。
雪花模型對星形模型的維度表進一步標準化,對星形模型中的維度表進行了規範化處理。雪花模型的維度表中儲存了正規化的資料,這種結構通過把多個較小的標準 化表(而不是星形模型中的大的非標準化表)聯合在一起來改善查詢效能。由於採取了標準化及維的低粒度,雪花模型提高了資料倉儲應用的靈活性。
這些連線需要花費相當多的時間。一般來說,一個雪花形圖表要比一個星形圖表效率低。
3) 星座模式
一個複雜的商業智慧應用往往會在資料倉儲中存放多個事實表,這時就會出現多個事實表共享某一個或多個維表的情況,這就是事實星座,也稱為星系模式(galaxy schema)。
4) 資料集市
資料集市是在構建資料倉儲的時候經常用到的一個詞彙。如果說資料倉儲是企業範圍的,收集的是關於整個組織的主題,如顧客、商品、銷售、資產和人員等方面的 資訊,那麼資料集市則是包含企業範圍資料的一個子集,例如只包含銷售主題的資訊,這樣資料集市只對特定的使用者是有用的,其範圍限於選定的主題。
資料集市面向企業中的某個部門(或某個主題)是從資料倉儲中劃分出來的,這種劃分可以是邏輯上的,也可以是物理上的。
資料倉儲中存放了企業的整體資訊,而資料集市只存放了某個主題需要的資訊,其目的是減少資料處理量,使資訊的利用更加快捷和靈活。
資料倉儲由於是企業範圍的,能對多個相關的主題建模,所以在設計其資料構成時一般採用星系模式。
轉載:http://hi.baidu.com/mitee/blog/item/f85525f34464955c342acc21.html
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/15720542/viewspace-678156/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 資料倉儲中的分析SQL——資料倉儲手冊SQL
- 資料倉儲—資料倉儲—Sybase IQ 介紹
- 資料倉儲
- 設計資料倉儲和資料倉儲的粒度
- 關於資料倉儲工程師的一般面試題目工程師面試題
- 資料倉儲—資料倉儲—NCR Teradata Warehouse 介紹
- 資料倉儲之路
- BI、資料倉儲和資料分析之間的區別
- SQL Server資料倉儲的構建與分析SQLServer
- SaaS 模式雲資料倉儲 MaxCompute 資料安全最佳實踐模式
- 雲端資料倉儲的模式選型與建設模式
- 資料庫倉庫系列:(一)什麼是資料倉儲,為什麼要資料倉儲資料庫
- 資料庫和資料倉儲資料庫
- 資料倉儲—資料倉儲—IBM DB2 Datawarehouse 介紹IBMDB2
- 深入分析大資料時代中的資料倉儲技術大資料
- 網站資料分析:資料倉儲相關的問題(三)網站
- [數倉]資料倉儲設計方案
- 資料倉儲 - ER模型模型
- 認識資料倉儲
- NoSQL 和資料倉儲SQL
- ORACLE 資料倉儲概念Oracle
- 資料倉儲概論
- 資料倉儲指南 (轉)
- 構建資料倉儲
- XXX資料倉儲分析模型設計文件模型
- EF Core 倉儲模式模式
- 資料倉儲和後設資料
- 資料倉儲應該用什麼方案——資料倉儲實施方案概述
- .NET Core MongoDB資料倉儲和工作單元模式封裝MongoDB模式封裝
- .NET Core MongoDB資料倉儲和工作單元模式實操MongoDB模式
- 什麼是資料倉儲?
- 資料倉儲建模方法論
- 什麼是資料倉儲
- 資料倉儲經驗概念
- 資料倉儲 ODS簡介
- 資料倉儲的組成
- 資料倉儲設計(轉)
- 資料倉儲中的概念