資料庫和資料倉儲

qq_23473123發表於2017-03-18

資料庫

定義

資料庫就是用來儲存資料的,存資料肯定不能亂存,要有一定的組織,所以需要分類等。資料庫要儘可能減少冗餘(幾大正規化)、較高的資料獨立性(不會侷限於應用,通過資料增刪查改來統一管理)、易擴充套件性和在一定範圍內為多個使用者共享

三個層次

以內模式為框架所組成的資料庫叫做物理資料庫;以概念模式為框架所組成的資料叫概念資料庫;以外模式為框架所組成的資料庫叫使用者資料庫。

⑴ 物理資料層。

它是資料庫的最內層,是物理存貯裝置上實際儲存的資料的集合。這些資料是原始資料,是使用者加工的物件,由內部模式描述的指令操作處理的位串、字元和字組成。

⑵ 概念資料層。

它是資料庫的中間一層,是資料庫的整體邏輯表示。指出了每個資料的邏輯定義及資料間的邏輯聯絡,是存貯記錄的集合。它所涉及的是資料庫所有物件的邏輯關係,而不是它們的物理情況,是資料庫管理員概念下的資料庫。

⑶ 使用者資料層。

它是使用者所看到和使用的資料庫,表示了一個或一些特定使用者使用的資料集合,即邏輯記錄的集合。

資料庫不同層次之間的聯絡是通過對映進行轉換的。

資料倉儲

定義

資料倉儲存在的原因是一個“集團”有很多“分部”,分部有各自的資料庫,總部需要各分部的“彙總”資訊來做“決策”,這時候資料倉儲就出現了,資料倉儲主要放的是彙總的決策資訊。

資料倉儲之父比爾·恩門(Bill Inmon)在1991年出版的“Building the Data Warehouse”(《建立資料倉儲》)一書中所提出的定義被廣泛接受,資料倉儲是一個面向主題的(Subject Oriented)、整合的(Integrate)、相對穩定的(Non-Volatile)、反映歷史變化(Time Variant)的資料集合,用於支援管理決策。

資料倉儲是一個過程而不是一個專案;資料倉儲是一個環境,而不是一件產品。資料倉儲提供使用者用於決策支援的當前和歷史資料,這些資料在傳統的操作型資料庫中很難或不能得到。資料倉儲技術是為了有效的把操作形資料整合到統一的環境中以提供決策型資料訪問。基於資料倉儲的決策支援系統由三個部件組成:資料倉儲技術,聯機分析處理技術和資料探勘技術。所做的一切都是為了讓使用者更快更方便查詢所需要的資訊,提供決策支援。

特點

1.面向主題和整合的:資料倉儲是決策層面有目的性的整合來自於分散的操作型資料,將所需資料從原來的資料中抽取出來,進行加工與整合,統一與綜合之後才能進入資料倉儲;

2.不可更新的:是”彙總“資訊不是原始資料不需要更新。

3.大容量的:時間序列資料集合通常都非常大。

4.非規範化的:Dw資料可以是而且經常是冗餘的。

5.後設資料的:將描述資料的資料儲存起來。

6.高效、高質量的:給”決策“提供依據必須高效、高質量。

資料庫和資料倉儲的區別

1.資料來源和目標不同:資料庫的資料來源通常是來之於”生活“,目標是將生活中的資料儲存和管理,而資料倉儲的數源來之於資料庫它是儲存分析和彙總資料庫資料的“結果”為了決策使用。

2.不修改:資料倉儲資料通常情況下不會修改。

3.冗餘:資料庫設計的時候會盡量避免冗餘,而資料倉儲設計注重於決策不會刻意避免冗餘。

4.與時間相關:資料庫得資料不強調有時間資訊,但是資料倉儲的資料強調,因為決策大部分需要關注時間因素。

相關文章