大資料_03
01 大資料概述
資料來源: 瞭解大資料到來之前,傳統資料的通用處理模式
1、企業內部管理系統 ,如員工考勤(打卡)記錄。 2、客戶管理系統(CRM)
資料特徵: 1、資料增長速度比較緩慢,種類單一。 2、資料量為GB級別,資料量較小。
資料處理方式: 1、資料儲存在資料庫中。處理時以處理器為中心,應用程式到資料庫中檢索資料再進行計算(移 動資料到程式端)
遇到的問題: 1、資料量越來越大、資料處理的速度越來越慢。 2、資料種類越來越多,出現很多資料庫無法儲存的資料,如音訊、照片、視訊等。
02 什麼是大資料?(Big Data)
是指無法在一定時間範圍內用常規軟體工具進行捕捉、管理和處理的資料集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的資訊資產。
是指一種規模大到在獲取、儲存、管理、分析方面大大超出了傳統資料庫軟體工具能力範圍的資料集合,具有海量的資料規模、快速的資料流轉、多樣的資料型別和價值密度低四大特徵。
資料的儲存單位 最小的基本單位是bit 1 Byte =8 bit 1 KB = 1,024 Bytes = 8192 bit
KB MB GB TB PB EB ZB YB BB NB DB 進率1024
03 傳統資料與大資料的對比
04 大資料的特點
Volume(大量): 資料量巨大,從TB到PB級別。
Velocity(高速): 資料量在持續增加(兩位數的年增長率)。
Variety(多樣): 資料型別複雜,超過80%的資料是非結構化的。
Value(低密度高價值): 低成本創造高價值。
資料來自大量源,需要做相關性分析。
需要實時或者準實時的流式採集,有些應用90%寫vs.10%讀。
資料需要長時間儲存,非熱點資料也會被隨機訪問。
4.1 傳統資料與大資料處理伺服器系統安裝對比
4.2 大資料下伺服器系統安裝
相關文章
- 大資料03-整合 Flume 和 Kafka 收集日誌大資料Kafka
- 大資料日知錄 03 叢集 分散式協調大資料分散式
- 資料結構03-棧資料結構
- day4-03資料存取
- 03 資料輸入-輸出
- 大資料,大資料,大資料大資料
- 讀資料湖倉03不同型別的資料型別
- JavaScript資料結構03 – 佇列JavaScript資料結構佇列
- JavaScript資料結構03 - 佇列JavaScript資料結構佇列
- Python資料型別詳解03Python資料型別
- 資料結構與演算法03資料結構演算法
- 03.Java資料結構問題Java資料結構
- Pytorch | Tutorial-03 資料轉換PyTorch
- 大資料應用-Flume+HBase+Kafka整合資料採集/儲存/分發完整流程測試03.大資料Kafka
- 03-mysql資料庫怎刪改查MySql資料庫
- 動手學習資料分析 Task03
- 走進大資料,感受大資料大資料
- 大資料VS大擁堵:大資料治理交通大資料
- 大資料資料收集大資料
- CSS系列 (03):CSS三大特性CSS
- 大資料概念:史上最全大資料解析大資料
- 大資料大利潤–資料資訊圖大資料
- 資料結構基礎03-紅黑樹資料結構
- 《MySQL 入門教程》第 03 篇 管理資料庫MySql資料庫
- 資料治理 - [03] 專業術語及其說明
- 03-前後端資料傳輸格式-下後端
- 大資料與資訊保安(六)天網系統與大資料 大資料大資料
- 大資料如何採集資料?大資料的資料從何而來?大資料
- 大資料:大資料之基礎語法大資料
- 大資料治理——搭建大資料探索平臺大資料
- 什麼叫大資料 大資料的概念大資料
- 大資料筆記01--大資料概述大資料筆記
- 大資料hadoop資料大資料Hadoop
- 大資料學習資料大資料
- 大資料的資料模型大資料模型
- 【雲端大資料實戰】大資料誤區、大資料處理步驟分析大資料
- 大資料專家:大資料7大最奇特應用大資料
- 大資料 大營銷大資料