IT大佬告訴你大資料有哪些特點,新人學習必知

大資料學習發表於2019-08-28

說起大資料,估計大家都覺得只聽過概念,但是具體是什麼東西,怎麼定義,沒有一個標準的東西,所以我建議還是從字面上來理解大資料,在維克托邁爾-舍恩伯格及肯尼斯庫克耶編寫的《大資料時代》提到了大資料的4個特點:

1大量

大資料的特徵首先就體現為“大”,從先Map3時代,一個小小的MB級別的Map3就可以滿足很多人的需求,然而隨著時間的推移,儲存單位從過去的GB到TB,乃至現在的PB、EB級別。只有資料體量達到了PB級別以上,才能被稱為大資料。隨著資訊科技的高速發展,資料開始爆發性增長。社交網路、行動網路、各種智慧工具等,都成為資料的來源。淘寶網近4億的會員每天產生的商品交易資料約20TB。迫切需要智慧的演算法、強大的資料處理平臺和新的資料處理技術,來統計、分析、預測和實時處理如此大規模的資料。

IT大佬告訴你大資料有哪些特點,新人學習必知

2高速

就是透過演算法對資料的邏輯處理速度非常快,1秒定律,可從各種型別的資料中快速獲得高價值的資訊,這一點也是和傳統的資料探勘技術有著本質的不同。並且這些資料是需要及時處理的,因為花費大量資本去儲存作用較小的歷史資料是非常不划算的。基於這種情況,大資料對處理速度有非常嚴格的要求,伺服器中大量的資源都用於處理和計算資料,很多平臺都需要做到實時分析。資料無時無刻不在產生,誰的速度更快,誰就有優勢。

如果你想要學好大資料最好加入一個好的學習環境,可以來這個Q群251956502 這樣大家學習的話就比較方便,還能夠共同交流和分享資料

IT大佬告訴你大資料有哪些特點,新人學習必知

3多樣

如果只有單一的資料,那麼這些資料就沒有了價值。廣泛的資料來源,決定了大資料形式的多樣性。任何形式的資料都可以產生作用,目前應用最廣泛的就是推薦系統,如淘寶,網易雲音樂、今日頭條等,這些平臺都會透過對使用者的日誌資料進行分析,從而進一步推薦使用者喜歡的東西。日誌資料是結構化明顯的資料,還有一些資料結構化不明顯,例如圖片、音訊、影片等,這些資料因果關係弱,就需要人工對其進行標註。

IT大佬告訴你大資料有哪些特點,新人學習必知

4價值

這也是大資料的核心特徵。現實世界所產生的資料中,有價值的資料所佔比例很小。你如果有1PB以上的全國所有20-35年輕人的上網資料的時候,那麼它自然就有了商業價值,比如透過分析這些資料,我們就知道這些人的愛好,進而指導產品的發展方向等等。如果有了全國幾百萬病人的資料,根據這些資料進行分析就能預測疾病的發生,這些都是大資料的價值。大資料運用之廣泛,如運用於農業、金融、醫療等各個領域,從而最終達到改善社會治理、提高生產效率、推進科學研究的效果。

IT大佬告訴你大資料有哪些特點,新人學習必知

大資料已經成為過去幾年中大部分行業的遊戲規則,行業領袖,學者和其他知名的利益相關者都同意這一點,隨著大資料繼續滲透到我們的日常生活中,圍繞大資料的炒作正在轉向實際使用中的真正價值。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69917001/viewspace-2655277/,如需轉載,請註明出處,否則將追究法律責任。

相關文章