DW2.0下一代資料倉儲架構 前言(讀書筆記)

thamsyangsw發表於2014-10-29

 

版權宣告:
該系列文章(DW2.0下一代資料倉儲架構)內容系作者學習用筆記,
歡迎共同學習,所載內容版權歸原書作(譯)者所有,請勿轉載商用。


    資料倉儲已經問世二十多年,它已經成為資訊科技基礎設施的基本組成部分。
    資料倉儲能夠為企業提供整合的、粒度的、歷史的資料結構。

    當前資料倉儲存在的問題:
    一、當前對資料倉儲有多種不同的解釋和實現方式。例如:聯合資料倉儲,主動資料倉儲,星狀模型資料倉儲,資料集市資料倉儲等。

實際上有多少家軟硬體供應商就有多少對資料倉儲的解釋和實現方式。
    二、資料倉儲結構也存在多種不同的解釋和實現方式。並且每一種實現在架構上都與其他的實現有很大區別。

    DW2.0應運而生,DW2.0中有很多重要的架構上的特徵。相對於第一代資料倉儲在技術和架構上都有很多進步。

    1、認識到資料倉儲中的資料的宣告週期。第一代資料倉儲僅將資料存放於磁碟儲存器中,事實上,資料一旦進入到資料倉儲,就有了自
己的宣告週期。進入資料倉儲後,資料開始老化,資料被訪問的可能性也逐漸降低。另一種現象是,隨著資料老化,資料容量會不斷增加,
並且大多數情況下這種增加是顯著地。想要處理訪問可能性不斷降低的大量資料,就需要一種特定的設計,以免資料倉儲的花費巨大,以至
於不能有效的使用資料倉儲。
    2、DW2.0包含非結構化資料。第一代資料倉儲完全由面向事務的結構化資料組成,這些資料倉儲提供大量有用的資訊,而現代資料倉儲
應該同時包含結構化和非結構化資料。非結構化資料中存在著大量有用的資訊,但如何獲取這些資訊事實上是非常大的挑戰。DW2.0具體描述
了包括結構化資料和非結構化資料。
    3、後設資料的重要性和作用在DW2.0中的開始得到認可。後設資料存在於資料庫管理系統中、業務物件領域中、ETL工具中。DW2.0需要的是
企業後設資料,是從企業級視角理解後設資料。需要調節後設資料的多有來源並將它們放置在一個能使它們協調工作的環境中。除此之外,在DW2.0
環境中還需要技術後設資料和業務後設資料的支援。
    4、隨著時間推移,業務在不斷髮生變化,這些變化通常反映在資料模型上。但是資料倉儲的技術基礎卻不能很容易改變。DW2.0採用兩
種解決方案,1、Kalido這樣的軟體,為資料倉儲提供一種有延展性的技術基礎。2、在資料定義時,設計分離靜態資料和臨時資料。這兩種
方法對資料倉儲的技術基礎隨著業務需求的改變而改變來說有很好的效果。
   

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/26613085/viewspace-1312774/,如需轉載,請註明出處,否則將追究法律責任。

相關文章