girl-with-the-dragon-tatoo8

“大資料”似乎是個企業才會感興趣的詞彙,類似商業智慧和情報分析的翻新說法,自從2008年世界進入”黑天鵝“時代,資料分析和預測未來的能力正成為企業生存和發展的核心競爭力。改革三十年我們經歷的企業價值觀也許可以分為三個橋段:”時間就是金錢“、”人才最寶貴“和”資訊創造價值“。

但人們往往忽視了大資料給個人帶來的挑戰和機遇,正如管理大師彼得德魯克在《二十一世紀的管理挑戰》中所預言的那樣:資訊科技將從“技術”向“資訊”轉變,二十一世紀的知識工人和管理人員,必須是資訊的駕馭者。其實,對於普通的消費者也是一樣。

兩部電影的啟示

如果說“大資料”的定義是“當資料規模本身成為一個問題。”那麼大資料時代顯然已經到來,面臨“大問題”的不僅僅是CCTV黃金時段的廣告主,也包括消費者自己。這個判斷並非基於70後的宅男硬碟裡已經儲存了上T的蒼井空,或者數以千萬計的中國網際網路使用者的賬號密碼已經唾手可得,或者大資料創業公司Splunk在華爾街掙了大錢;事實上,社會化媒體時代的網路文字、日誌、點評、圖片、視訊和各種UGC內容已經為個人大資料和快資料應用提供了沃土。但大資料的財富金殿,是由無數公民隱私資料堆積起來的,那些大型網際網路公司、廣告商甚至比我們更瞭解我們自己。

有人說我們今天生活在奧威爾的《1984》中,老大哥掌握我們的一舉一動,以及下一舉和下一動,這一點也不誇張。

今天的消費者面臨太多的選擇,每天一早起來,該看什麼樣的新聞、吃什麼品牌的餅乾、喝什麼牌子的牛奶、聽什麼音樂、坐地鐵還是公交、走哪條路線、看什麼書…我們今天面臨的問題是選擇太多、陷阱太多、資訊太多太快。微博、部落格、門戶、電視、手機、廣播無時無刻不在轟炸商業資訊,公知、憤青、五毛、死託、標題黨、磚家、水軍充斥網路空間,意見領袖扎堆,精神偶像分裂,真相往往就在指尖,但卻又亂花迷眼,漸行漸遠。我們的膝上型電腦硬碟容量增大了十倍,能裝下整個國會圖書館,但獨立思考、決策和創造的能力卻沒有相應增長。

如果說《點球成金》是企業家們的大資料啟蒙電影,那麼《龍紋身的女孩》告訴我們,資料就是生產力,資訊改變命運,你可以貧窮到只擁有一臺MacBook Pro,但卻擁有改變世界的力量。

 

資料民主化

powerdata09

在定期舉辦大資料大獎賽的Kaggle網站上,並非所有的贏家都是專業資料科學家,文科生拔得頭籌的例子也不是沒有,甚至有報導指出最優秀的大資料人才應該來自物理學領域而不是數學天才,因為物理好的人系統觀念和解決問題的能力更強。這佐證了一個觀點:在大資料資訊源和工具極大豐富的今天,最寶貴的不是資料技術人才,而是那些能提出正確問題的人,即使他們不知道Hadoop是何方神象。例如電動汽車充電站的選址問題,如果電力公司公佈一些電力消費地理資料,任何一個大資料愛好者都可能給出一個比政府規劃更合理的分析,從而避免汽車充電導致的區域性電力供應緊張。

powerdata01

資料的民主化還意味著政府和行業非敏感資料的公開化,讓基於資料的政通人和變得不再是天方夜譚,讓資料說話,比讓公知說話顯然更加靠譜。在英國政府公佈的政府網站十大設計原則中,”用資料設計“被放在了非常顯眼的位置上。美國芝加哥伊利諾斯大學最近的一次美國地方政府電子政務調查發現,12個受調查美國大城市都擁有開放資料門戶。(Open Data Portal),所謂Open Data,就是政府在網上公開政府部門掌握的一些資料,如消防、犯罪率、稅收、能源消耗等資料,通過web2.0的眾包模式向公眾開放,藉助“公眾智慧”來進一步分析這些資料,獲得有價值的分析結果。此外,Open Data還是促進政務透明的一個有力措施。

 

資料化生存

 

combine在大資料時代,對於消費者來說,面臨的問題其實與企業類似,如何通過唾手可得的海量資料進行分析,從而進行有利於個人發展和生存的高質量決策。

我們都知道今天的網際網路已經沒有個人隱私可言,個人大資料分析得益於智慧手機的普及和移動應用的豐富,近年來資料來源的極大豐富(包括各種途徑洩露的社交隱私資料甚至維基解密等地下資料),以及網路上大量的開源大資料工具和廉價的頻寬和空間。如今,一位略懂技術的消費者都可以用現成的工具(例如Google Analytics或Splunk)和資料來源進行社會化媒體資料分析、網路新聞傳播分析、網站使用者分析乃至韓寒是否代筆分析,我們還能搞清楚為什麼新浪微博不同地區的刪帖率相差巨大,如何從新聞下架速度判斷社會熱點和暗流,股票和網民情緒的內在關聯,京東的哪些商品價格比實體店鋪還貴,哪些商品的使用者評價最高?哪個汽車品牌出車禍的機率更高?哪種工作薪酬行情看漲?

說到資料化生存,IBM全球商業服務部的Paul Brody認為,個人健康資料分析將成為“個人大資料”市場的一個熱點。確實,胖子不是一口吃成的,如果能精確記錄我們日常飲食的熱量和成分,睡眠和運動記錄,相信大多數人都能找到控制體重的良方。從幫助壓力山大的商務人士分析睡眠模式的iPhone程式,到張欣熱衷使用的耐克健身程式,今天的個人健康資料隨著智慧手機和聯網健康電子產品的極大豐富而急速膨脹。

在資料化生存時代,你該讀什麼、說什麼、想什麼、吃什麼、如何健身、如何更好地活下去,將越來越多地變成一項資料分析命題。

 

資料化消費

Open_Data_Cloud_Box

在擁有大型資料中心、資料科學家、消費心理專家以及掌握海量消費者網路行為資料的企業面前,消費者無疑是弱勢的。毫不誇張地說,通過分析消費記錄和行蹤資料,今天的沃爾瑪能夠比新婚丈夫更先知道妻子是否懷孕,音樂推薦網站Pandora能比你自己更瞭解你喜歡什麼音樂,而亞馬遜則向不知道該買點什麼的“打醬油顧客”推薦能勾起他們購物慾望的產品。

大資料似乎在製造新的數字鴻溝,政府與公民、企業與消費者之間的資訊不對稱產生的不公平交易和權益盤剝似乎將更加嚴重。但是消費者也並非完全沒有反擊的機會。

一些大資料創業公司正在成為消費者的“盟軍”,通過資料分析幫助消費者爭取更好的交易價格和時機。(亞馬遜誘惑消費者去實體店鋪拍攝商品條碼將交易機會導向網購的“齷蹉”行為可以看做是一宗企業與企業間的大資料鴻溝)

2008年被微軟收購的Farecast可以幫助旅客選擇最佳機票購買時機,在普通消費者來看,訂飛機票是一件非常複雜且“無厘頭”的數字遊戲,訂得早不如訂得巧。通過建立航空公司票價資料的預測分析模型,Farecast能幫助消費者在與航空公司收益管理系統的博弈中佔據主動地位。而在酒店預訂方面,由於房間和價格變化很快,Farecast提出用LBS+移動分析的方案,消費者可以在手機上隨時掌握最佳的訂房時機。

另外一家創業公司Decide.com則把消費者的資料分析能力擴充套件到了數碼和家電領域,Decide.com能分析某個特定商品,例如三星的Galaxy SIII的上千個資料來源,包括價格歷史、新品傳言等。預測數碼產品的價格與預測機票價格有很大的不同,機票價格的資料相對“乾淨”和結構化,而數碼產品的資料則是標準的“大資料分析”,資料格式和來源極大豐富,各種產品部落格、新聞報導、比價資料、價格歷史、優惠券資訊、社交網站評論。在這些“大資料”和“快資料”提供的交易機會面前,從某種程度看,企業和消費者是平等的。

目前橫亙在大資料和大眾之間的最大鴻溝是大資料的可用性問題,消費者可不希望像學習DOS命令一樣去掌握大資料分析工具的使用技巧,消費者需要的是“美圖秀秀”而不是專業的Photoshop。

幸運的是,已經有不少創業公司在大資料的視覺化、語義分析、移動分析、預測分析方面發力,資料化消費的時代已經到來。

Via:IT經理網