大資料與網際網路的關係

dicksonjyl560101發表於2015-03-20
 大資料平臺 大資料中心 網路大資料()
大資料的專家維克托·邁爾-舍恩伯網際網路行動通訊、物聯網的發展,資料不斷爆炸式的增長,人類進入了大資料時代。作為繼雲端計算,IT產業的又一次新技術、顛覆性革命,無論是芝麻開門般的財富奇蹟,還是對人們生活的影響。大資料不斷地被提及,更是成為了影響當今世界創新的重要知識點。
什麼是大資料?

    曾在《大資料時代》一書中提到,以前人們使用的大多是抽樣資料,而大資料則包含了所有資料。另外,大資料關注效率,而不是精準度,關注關聯性,而不是因果關係。以前的大多數資料被稱為結構化資料,比如“你幾歲?我15歲”,而“我今天說了什麼話?我今天吃了什麼東西?”這些資料則被稱為非結構化資料,主要指一些描述性的資料。隨著網際網路的發展,這些非結構化資料被收集並存放起來,對於這些資料加以分析利用,便構成了大資料的應用,這也是大資料不同於之前資料的最為重要的一點。

大資料到底有多大?

    大資料所涉及的資料量非常大,而且正變得越來越大。自人類有文字記載到2012年為止,古今中外所有人類出版的資料,共計資料200PB。而在網際網路發展的短短十幾年裡,資料量就已經步入了EB、ZB時代。以1號店為例,1號店一年產生的資料約為20個PB。這20個PB只是有過資料儲存的這部分,不是1號店產生的全部資料。這些資料相當於有人類文字記載到2012年止所有資料的十分之一,而且,這只是1號店一家公司所產生的資料量。資料量正以驚人的速度爆炸並發展,是隨著網際網路的應用而產生的爆發式增長。

備註:單位從小到大排序:Byte、KB、MB、GB、TB、PB、EB、ZB、YB、DB、NB 進率1024

1Byte = 8 Bit

1KB = 1,024 Bytes

1MB = 1,024 B = 1,048,576 Bytes

1GB = 1,024 MB = 1,048,576 KB = 1,073,741,824 Bytes

1TB=2的40次方Byte=1099511627776 Byte

1PB=2的50次方Byte=1125899906842624Byte

1EB=2的60次方Byte= 1152921504606846976 Byte

1ZB=2的70次方Byte= 1180591620717411303424 Byte

1YB=2的80次方Byte= 1208925819614629174706176 Byte

1DB=2的90次方Byte= 1237940039285380274899124224 Byte

1NB=2的100次方Byte= 1267650600228229401496703205376 Byte

這麼多資料從哪兒來?

    以一位瀏覽了1號店網頁的顧客為例,他從哪裡來?在1號店網站瀏覽了哪些頁面?看過哪些商品?涉及的品類有多少?是否使用了搜尋功能?還是隻是隨便瀏覽?這些看似不經意的資料都會儲存在1號店的大資料平臺。為什麼資料越來越多?就是因為人們無時無刻不產生資料。比如上海科普大講壇邀請1號店CTO韓軍在1點45分進行了關於大資料的演講,這個時間點便產生了一些資料。還有大家無時無刻不使用的移動裝置,也會不斷產生資料。每個人都在不斷地產生各式各樣的資料,這就使得資料越來越多,無所不在。

大資料是如何應用的?

    以一個懷孕的女性為例,她的消費行為可能會在懷孕的前四周或者前五週突然發生變化,比如在她網購時,原來喜歡買甜食,現在則偏好酸的食物,這些資訊就會被 納入企業資料庫,並被記錄下來。隨後,公司會為這位孕婦推送與懷孕相關的產品優惠券,這就是典型的大資料應用。亞馬遜有一個非常神奇的大資料應用,叫做 “未購買先發貨”。亞馬遜作為全球最大的電子商務網站,對於大資料有著許多應用。比如,亞馬遜會根據消費者在網站上的消費行為,預測顧客下個禮拜的需求, 如牙膏、薯片、大米、醬油等。亞馬遜會自動生成訂單,將這些商品送到顧客家中。顧客作為消費者主體,在根本沒有意識到自己需要這些東西的時候,商品就已經 送到手中。以實際應用效果來看,絕大多數消費者認為“未購買先發貨”的預測較為準確,會愉快地簽收訂單。

大資料下的個人隱私?

    現代人使用智慧手機時,商家會將資訊存在雲端備份,這些資料的存在,不可避免地會引發隱私問題。美國曾有預測學家說過,在未來十年或二十年,現在人們認為 非常重要的隱私,會慢慢轉變為每個人都樂於將資料共享,這也將成為社會發展的一個過程。大資料下的資訊處理,可以將人們在圖書館借書的資訊和網上購物的信 息產生交集,比如在人們在圖書館借閱了健康類書籍後,在網上買披薩時,會為顧客推薦更健康的披薩。當資料產生關聯後,也就產生了價值。在大資料下,隱私與 便利永遠存在矛盾,可謂沒有絕對的隱私。在這個資料化生存的時代,資料跟隱私是相對的。隱私和便利之間,也在慢慢尋求平衡。

電商對於大資料有著怎樣的應用?

    對電商來說賣什麼產品?以什麼價格銷售?如何防止價格設定出錯?應該賣什麼商品?什麼商品好賣?什麼商品不好賣?都需要運用大資料。定價對於電商領域的競爭而言非常重要。比如,在大資料的應用下,1號店設計了名為“智慧價格”的應用。每天會自動在網站上搜尋大量的產品價格,然後根據搜取的價格資訊,對價格進行自動調整,以保證1號店的產品價格處於可競爭性的地位。在各大電商齊打價格戰的“雙十一”,1號 店的價格系統對於部分熱銷商品,每隔一兩分鐘就會對其他電商的商品價格進行掃描比對,實時推動價格變動。在電商的運營中,銷量、價格和庫存有著密不可分的 關係,庫存又和備貨有著重要關係,這些都需要非常強大的銷售預測系統進行支撐。還有許多諸如此類的大資料應用不勝列舉,大資料的應用對於電商打價格戰,提 高毛利,更好地服務消費者都有著巨大幫助。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-1467943/,如需轉載,請註明出處,否則將追究法律責任。

相關文章