第一篇之認識大資料
大資料(Big data)
大資料(Big data)通常用來形容一個公司創造的大量非結構化和半結構化資料,這些資料在下載到關係型資料庫用於分析時會花費過多時間和金錢。大資料分析常和雲端計算聯絡到一起,因為實時的大型資料集分析需要像MapReduce一樣的框架來向數十、數百或甚至數千的電腦分配工作。
戰略意義
大資料技術的戰略意義不在於掌握龐大的資料資訊,而在於對這些含有意義的資料進行專業化處理。
分類
大資料可分成大資料技術、大資料工程、大資料科學和大資料應用等領域。目前人們談論最多的是大資料技術和大資料應用。
4個“V”
大資料的4個“V”,或者說特點有四個層面:第一,資料體量巨大。從TB級別,躍升到PB級別;第二,資料型別繁多。前文提到的網路日誌、視訊、圖片、地理位置資訊等等。第三,價值密度低,商業價值高。以視訊為例,連續不間斷監控過程中,可能有用的資料僅僅有一兩秒。第四,處理速度快。1秒定律。最後這一點也是和傳統的資料探勘技術有著本質的不同。業界將其歸納為4個“V”——Volume,Variety,Value,Velocity。
換算單位
最小的基本單位是Byte,按順序給出所有單位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、DB、NB,
它們按照進率1024(2的十次方)來計算:
1Byte = 8 bit
1 KB = 1,024 Bytes
1 MB = 1,024 KB = 1,048,576 Bytes
1 GB = 1,024 MB = 1,048,576 KB = 1,073,741,824 Bytes
1 TB = 1,024 GB = 1,048,576 MB = 1,073,741,824 KB = 1,099,511,627,776 Bytes
1 PB = 1,024 TB = 1,048,576 GB =1,125,899,906,842,624 Bytes
1 EB = 1,024 PB = 1,048,576 TB = 1,152,921,504,606,846,976 Bytes
1 ZB = 1,024 EB = 1,180,591,620,717,411,303,424 Bytes
1 YB = 1,024 ZB = 1,208,925,819,614,629,174,706,176 Bytes
1 DB = 1024 YB = 1,237,940,039,285,380,274,899,124,224 Bytes
1 NB = 1024 DB = 1,267,650,600,228,229,401,496,703,205,376 Bytes
相關文章
- 資料探勘——認識資料
- 大資料的力量來自“大成智慧”資訊時代大資料的再認識大資料
- 認識資料倉儲
- 源計劃之從HashMap認識資料結構HashMap資料結構
- 資料分析基礎—3.1 認識資料
- eMarketer:營銷人員認識到大資料是件大事大資料
- 【資料結構篇】認識資料結構資料結構
- 一張圖認識天下資料庫資料庫
- 【資料結構】-巨集觀認識資料結構
- 初識大資料大資料
- 郭全中:對大資料的認識該正本清源大資料
- 認識物聯網系列—物聯網與雲端計算、大資料大資料
- 認識資料實時同步神器—Canal
- 全面認識資料指標體系指標
- 認識及操作SQL Server 資料庫SQLServer資料庫
- 阿里雲大資料ACP認證知識點梳理3——產品特點(資料整合)阿里大資料
- [譯]大資料之“資料黑市”大資料
- 大資料:大資料之基礎語法大資料
- 大資料之偽大資料
- 大資料並沒有死,可能是你已經不認識它了大資料
- 大資料並沒有死,只不過你已經不認識它了大資料
- Wireshark資料抓包教程之認識捕獲分析資料包
- 【MySQL資料庫】認識資料庫+環境搭建--------Windows系統MySql資料庫Windows
- 1.4. 認識你的資料庫版本號資料庫
- Oracle資料庫字符集的全面認識Oracle資料庫
- 【大前端】認識單點登入前端
- 大資料之概率論大資料
- 大資料之Flume(二)大資料
- 保姆級教程,帶你認識大資料,從0到1搭建 Hadoop 叢集大資料Hadoop
- 大資料的知識體系大資料
- “大資料”可是個識才利器大資料
- 大資料圖資料庫之TAO資料庫大資料資料庫
- 效能測試之 JVM 概念認識JVM
- OpenCV認識之發展歷史OpenCV
- 精通RPM之認識篇(轉)
- 企業大資料-之機器資料大資料
- 大資料之傷--小資料思維大資料
- 大資料分析之資料下鑽上卷大資料