大資料基礎(一)——關係+文章
一、DB、ETL、DW、OLAP、DM、BI關係結構圖
轉載自:http://www.cnblogs.com/ycdx2001/p/4538750.html
(1)DB/Database/資料庫——這裡一般指的就是OLTP資料庫,線上事物資料庫,用來支援生產的,比如超市的買賣系統。DB保留的是資料資訊的最新狀態,只有一個狀態!比如,每天早上起床洗臉照鏡子,看到的就是當時的狀態,至於之前的每天的狀態,不會出現的你的眼前,這個眼前就是db。
(2)DW/Data Warehouse/資料倉儲——這裡儲存的是DB中的不同時間點的狀態,比如,每天早上洗完照鏡子時,都拍一張照片,天天這樣,這些照片放入到一個相簿中,之後就可以檢視每一天的狀態了,這個相簿就是資料倉儲,他儲存的是資料在不同時間點的狀態,對同一個資料資訊,保留不同時間點的狀態,就便於我們做統計分析了。
(3)ETL/Extraction-Transformation-Loading——用於完成DB到DW的資料轉存,它將DB中的某一個時間點的狀態,“抽取”出來,根據DW的儲存模型要求,“轉換”一下資料格式,然後再“載入”到DW的一個過程,這裡需要強調的是,DB的模型是ER模型,遵從正規化化設計原則,而DW的資料模型是雪花型結構或者星型結構,用的是面向主題,面向問題的設計思路,所以DB和DW的模型結構不同,需要進行轉換。
(4)OLAP——線上分析系統,簡單說就是報表系統,銷售報表,統計報表,等等,這個大家都熟悉,當然,OLAP的統計要更復雜更豐富一些,比如切面,鑽取等等。
(5)DM/Data Mining/資料探勘——這個挖掘,不是簡單的統計了,他是根據概率論的或者其他的統計學原理,將DW中的大資料量進行分析,找出我們不能直觀發現的規律,比如,如果我們每天早上照相,量身材的時候,還記錄下頭一天吃的東西,黃瓜,豬腿,烤鴨,以及心情,如果記錄上10年,形成了3650天的相貌和飲食心情的資料,我們每個人都記錄,有20萬人記錄了,那麼,我們也許通過這些記錄,可以分析出,身材相貌和飲食的客觀規律;再說一個典型的例項,就是英國的超市,在積累了大量資料之後,對資料分析挖掘之後,得到了一個規律:將小孩的尿布和啤酒放在一起,銷量會更好——業務專家在得到該結論之後,仔細分析,知道了原因,因為英國男人喜歡看足球的多,老婆把小孩介紹男人看管,小孩尿尿需要尿布,而男人看足球喜歡喝酒,所以兩樣商品有密切的關係,放在一起銷售會更好!
(6)BI/Business Intelligence/商業智慧——領導,決策者,在獲取了OLAP的統計資訊,和DM得到的科學規律之後,對生產進行適當的調整,比如,命令超市人員將啤酒喝尿布放在一起銷售,這就反作用於DB修改存貨資料了——這就是整個BI的作用!
資訊科技經過近20年的大力發展,很多行業積累了很多珍貴的資料,真正的大資料時代到來了,也逐漸體現出 DB-ETL-DW-OLAP-DM-BI這條線路的重要性,希望大家能懂得這個大資料時代的價值,把握住機遇,有更加美好的未來!
二、大資料相關推薦文章
資料倉儲的價值:
http://webdataanalysis.net/web-data-warehouse/value-of-data-warehouse/
資料倉儲的基本構架:
http://webdataanalysis.net/web-data-warehouse/data-warehouse-frame/
資料倉儲的源資料型別:
http://webdataanalysis.net/web-data-warehouse/data-warehouse-source-data/
資料倉儲的多維資料模型:
http://webdataanalysis.net/web-data-warehouse/multidimensional-data-model/
資料立方體-維度與OLAP:
http://www.cnblogs.com/mq0036/p/4155832.html
DB、ETL、DW、OLAP、DM、BI關係結構圖:
http://www.cnblogs.com/ycdx2001/p/4538750.html
ODS與DW的關係
http://blog.csdn.net/hero_hegang/article/details/8691912
http://blog.sina.com.cn/s/blog_54c021fb01017v3k.html //這篇文章很好。推薦。
資料倉儲之ETL漫談
http://blog.csdn.net/heqiyu34/article/details/8502198
Linux下JDK安裝
http://blog.csdn.net/ubuntu64fan/article/details/8289335
ETL的一些概念
http://qsx1982-126-com.iteye.com/blog/1135590
事實表和維度表的關係
http://blog.csdn.net/rogerxi/article/details/3966782
淺談ThreadPool執行緒池
http://www.cnblogs.com/xugang/archive/2010/04/20/1716042.html
http://www.cnblogs.com/xiaofengfeng/archive/2012/12/21/2828387.html
對MapReduce過程的理解
http://blog.csdn.net/yeruby/article/details/21406793
使用Storm實時大資料分析
http://blog.csdn.net/hguisu/article/details/8454368
Hive與HBase區別
相關文章
- 大資料基本公式——一:基礎大資料公式
- java基礎相關文章Java
- 大資料——HBase基礎大資料
- 大資料之JAVA基礎(一):資料和變數大資料Java變數
- 大資料與程式語言關係大資料
- 大資料:大資料之基礎語法大資料
- 相關關係並不意味著因果關係 大資料應避免大混亂大資料
- 設計模式-UML關係基礎設計模式
- 【大資料】Spark RDD基礎大資料Spark
- 2. 大資料基礎大資料
- 大資料和人工智慧的關係大資料人工智慧
- 區塊鏈和大資料的關係區塊鏈大資料
- 關於DataTable的兩篇基礎文章
- 《資料庫》基礎題一:兩表相關查詢資料庫
- JSP規範、Servlet關係、基礎JSServlet
- sql大資料 基礎(檢視)SQL大資料
- 基礎資料結構大賞資料結構
- 大資料與網際網路的關係大資料
- 大資料時代的資料儲存,非關係型資料庫MongoDB大資料資料庫MongoDB
- 大資料基礎之開發第一個Java程式大資料Java
- 關係型資料庫,何以稱為“關係”資料庫
- Smartbi與你一起用大屏解鎖資料關係
- 大資料與雲端計算有什麼關係?大資料
- 雲端計算與大資料有什麼關係?大資料
- 大資料告訴你星座與錢的關係大資料
- 雲端計算和大資料有什麼關係?大資料
- 大資料解決方案-(基礎篇)大資料
- 大資料基礎架構總結大資料架構
- 大資料基礎----Python入門大資料Python
- 關係型資料庫與非關係型資料庫介紹!資料庫
- NoSQL:從關係型資料庫到非關係型資料庫SQL資料庫
- 資料關係比較:相關性 vs 因果關係
- Oracle 資料庫檢視與基表的關係Oracle資料庫
- 關係型資料庫資料庫
- 資料庫 - 關係演算資料庫
- 資料庫 - 關係代數與關係運算資料庫
- 基礎安全產品相關係統設計的一些思考
- 資料庫基礎知識詳解五:MySQL中的索引和其兩種引擎、主從複製以及關係型/非關係型資料庫資料庫MySql索引