名詞解釋:資料倉儲

iSQlServer發表於2010-09-17
 

資料倉儲(DW),將大量用於事務處理的傳統資料庫資料進行清理、抽取和轉換,並按決策主題的需要進行重新組織。大量組織機構已經發現,在當今這個充滿競爭和快速發展的世界,資料倉儲是一個很有價值的工具。資料倉儲系統構造方面的專家W.H.Inmon定義:“資料倉儲是一個面向主題的、整合的、時變的、非易失的資料集合,支援管理部門的決策過程”。這個定義指出了資料倉儲的主要特徵:面向主題的、整合的、時變的、非易失的,將資料倉儲與其他資料儲存系統(如關聯式資料庫系統、事務處理系統和檔案系統)區別開來。

首先,面向主題的,它需要為決策者提供綜合資訊,這類資訊的組織應當以企業中業務工作的主題內容為主線,它是資料和演算法的統一。資料從外部資料來源進入資料倉儲後,在一個主題的引導下,經彙總統一和必要的變換,最後以最適於使用的方式存放起來。因為只有這樣的組織方式能提供資訊的全方位可用。資料倉儲回答的是如:“我們的產品在哪個地區的市場份額最小”、“我們的產品質量問題出在哪裡?”等帶有主題特徵的問題,而傳統的資料庫回答如“我們的年產量是多少?”等專門性、片斷的問題。

其次,整合化。資料倉儲的資料雖然來自日常運算元據,但並不是這些資料的簡單歸併或搬家,其儲存的資料是日常運算元據的增值和統一處理,如統一的命名規則,統一的度量單位等,因為日常運算元據的結構,方法的實現是不同的編碼、不同的命名規則等。但是對於資料倉儲來說,不管如何設計、如何實現、結果必須一致,資料和方法必須按照單一的、全域性可接受的格式儲存。只有這樣,DSS才能在使用這些資料時不必關心這些資料的一致性問題。

第三,歷史性,反映歷史變化。操作型資料庫主要關心當前某一時間段內的資料,而資料倉儲中的資料通常包含歷史資訊,系統記錄了企業從過去某一地點到目前的各個階段的資訊,通過這些資訊,可以對企業的發展歷程和未來趨勢做出定量分析和預測。

第四,相對穩定性。操作型資料庫中的資料通常實時更新,資料根據需要及時發生變化。資料倉儲的資料主要供企業決策分析之用,所涉及的資料操作主要是資料查詢,一旦某個資料進入資料倉儲後,一般情況下將被長期保留,也就是資料倉儲中一般有大量的查詢操作,但修改和刪除操作很少,通常只需要定期的載入、重新整理。

概言之,資料倉儲是一種語義上一致的資料儲存,它充當決策支援資料模型的物理實現,並存放企業戰略決策所需資訊。資料倉儲也常常被看作一種體系結構,通常將異種資料來源中的資料整合在一起,支援結構化和專門的查詢與分析,支援決策的制定。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/16436858/viewspace-674283/,如需轉載,請註明出處,否則將追究法律責任。

相關文章