大資料引領我們走向資料智慧化時代

大資料學習發表於2019-04-23

半個世紀以來,隨著計算機技術全面融入社會生活,資訊爆炸已經積累到了一個開始引發變革的程度。它不僅使世界充斥著比以往更多的資訊,而且其增長速度也在加快。網際網路(社交、搜尋、電商)、移動網際網路(微博)、物聯網(感測器,智慧地球)、車聯網、GPS、醫學影像、安全監控、金融(銀行、股市、保險)、電信(通話、簡訊)都在瘋狂產生著資料。


全球每秒鐘傳送 2.9 百萬封電子郵件,一分鐘讀一篇的話,足夠一個人晝夜不息的讀5.5 年。每天會有 2.88 萬個小時的影片上傳到優酷上,足夠一個人晝夜不息的觀看3.3 年年。微博上每天釋出 5 千萬條訊息,假設10 秒鐘瀏覽一條資訊,這些訊息足夠一個人晝夜不息的瀏覽16 年。每天淘寶上將產生 6.3 百萬筆訂單,每個月網民在微信上要花費7 千億分鐘,被移動網際網路使用者傳送和接收的資料高達1.3EB。

馬雲成功預測2008 年經濟危機。“2008 年初,阿里巴巴平臺上整個買家詢盤數急劇下滑,歐美對中國採購在下滑。海關是賣了貨,出去以後再獲得資料;我們提前半年時間從詢盤上推斷出世界貿易發生變化了。”通常而言,買家在採購商品前,會比較多家供應商的產品,反映到阿里巴巴網站統計資料中,就是查詢點選的數量和購買點選的數量會保持一個相對的數值,綜合各個維度的資料可建立使用者行為模型。因為資料樣本巨大,保證使用者行為模型的準確性。因此在這個案例中,詢盤資料的下降,自然導致買盤的下降。

諸多領域的問題亟待解決,最重要的是每個人的資訊都被網際網路所記錄和保留了下來,並且進行加工和利用,為人所用,而這正是我們所擔憂的資訊保安隱患!更多的隱私、安全性問題:我們的隱私被二次利用了。多少密碼和賬號是因為“社交網路”流出去的?2011年4月索尼的系統漏洞導致7700萬使用者資料失竊;2011年4月,iOS被發現會按照時間順序記錄使用者的位置座標資訊;2011年CSDN密碼洩露事件等等。

眼下中國網際網路熱門的話題之一就是網際網路實名制問題,我願意相信這是個好事。畢竟我們如果明著亮出自己的身份,網際網路才能對我們的隱私給予更好保護。有了大資料的幫助,我們不會再將世界看作是一連串我們認為或是自然或者社會現象的事件,我們會意識到本質上世界是由資訊構成的。

現實世界所產生的資料中,有價值的資料所佔比例很小。相比於傳統的小資料,大資料最大的價值在於透過從大量不相關的各種型別的資料中,挖掘出對未來趨勢與模式預測分析有價值的資料,並透過機器學習方法、人工智慧方法或資料探勘方法深度分析,發現新規律和新知識,並運用於農業、金融、醫療等各個領域,從而最終達到改善社會治理、提高生產效率、推進科學研究的效果。


在大資料時代,每個人都會享受到大資料所帶來的便利。買東西可以足不出戶;有急事出門可以不用再隨緣等計程車;想了解天下事只需要動動手指。雖然大資料會產生個人隱私問題,但總的來說,大資料還是在不斷的改善我們的生活,讓生活更加方便。



來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69917001/viewspace-2642221/,如需轉載,請註明出處,否則將追究法律責任。

相關文章