大資料時代 一本好書

fei890910發表於2014-03-10
舍恩伯格的三個觀點:
   一、不要隨機樣本,而要全部資料
       在小資料時代,由於我們處理資料的能力有限。無法做到採集和處理全部的資料,所以採用抽樣的方式來分析資料,存在很多的缺陷。而在大資料時代,由於我們採集資料的能力大大的提高,儲存資料的代價越來越低,處理資料的工具越來越強大,可以做到全部資料的採集,儲存,分析。
   二、不要精確性,而要混雜性
       在小資料時代,由於我們採取的是抽樣分析少量的資料,細微的偏差 就會導致完全不同的分析結果。所以必須要求資料的精確性。 而在大資料時代,由於我們處理的全部的資料,資料量非常龐大,少量的資料偏差不會影響資料分析的最終結果。而且這是大資料的特性之一。
   三、不要因果關係,而要相關關係
       在大資料時代由於資訊的及時性是大資料價值的一個主要標準,如果事件A發生了,事件B也同時發生。知道這個資訊對於資料分析者來說已經足夠,並且提供給決策者使用。因果關係並不是大資料分析所必須的。

大資料時代的三個角色:
   一、基於資料本身的公司
       用於大量的資料,單其本身並不從資料中提取價值
   二、基於技能的公司
       擁有專業的技能,但其本身並沒有大量的資料。
   三、基於思維的公司
       本身沒有大量的資料,也沒有專業的資料處理技能,但是可以提供資料處理的創新性思維。
 

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29108064/viewspace-1104712/,如需轉載,請註明出處,否則將追究法律責任。

相關文章