“大資料”似乎在一夜之間闖入了任何一個關於網際網路未來的討論,成為一個炙手可熱無所不包的概念。但它是否真如許多IT行家們所言,將成為資訊科技領域又一片蘊藏無限潛能的處女地?還是隻是軟硬體巨頭們為了賣出更多產品而吹出的一個美麗泡沫?
正在大連舉行的2013夏季達沃斯開闢專場,以“大資料概念是否被過度炒作”為題,請四位嘉賓分成正反兩方,展開一場激辯。穿梭於各場彬彬有禮的“清談會”之間的聽者們,步入這場辯論時,無不感到意外之喜,目擊到一場有趣又有料的意見交鋒。
持正方觀點,即“大資料已被過度炒作”觀點的,出人意料地,是四位嘉賓中更年輕、更接近“技術宅男”的兩位,其中一位是美國Kaggle公司總裁兼首席科學家Jeremy Howard,另一位是迦納MPedigree網路公司總裁Bright Simons。持反方觀點,為大技術時代的到來歡呼的,一位是北京大學光華管理學院新媒體營銷研究中心副主任蘇萌,另一位是日本政治家、內閣成員山本一太。
在辯論之前,主持人先作了一次現場調查,同意“大資料是過度炒作”的聽眾稍占上風,佔比54.5%。聽眾被告知,在辯論結束後還會再來一輪投票,四位嘉賓的任務就是儘可能留住支持者,讓對方陣營倒戈。
辯論開始,正方嘉賓、科學家Howard起身走近聽眾席,一句話亮明觀點:資料不在多,而在怎麼用。他提出“一臺電腦論”,即科學家們研究所需的資料,最好用一臺電腦就能裝下,否則資料處理會過於繁瑣,無助於解決問題。他結合自身經驗說,隨著資料量的增大,研究的準確性一開始會隨之上升,但很快就會趨平。“舉個例子,如果我們把所有《星球大戰》鐵桿粉絲的資料拿來研究,就一定能準確地判斷出他們中誰會喜歡《魔戒》嗎?我們發現並非如此。”
反方嘉賓、北大的蘇萌教授起身應戰。他請大家原諒,“為了更流暢地表達觀點,我還是用中文”,引來聽眾理解的笑聲。他說,大資料剛剛露出冰山一角,在金融、零售等領域的運用上,還遠未釋放它的潛能。這有三個原因:一是因為不同機構間的資料還未真正流動起來,目前還只是資料“孤島”;二是完整的生態產業鏈還未形成,儘管通過行為資料分析已能夠分辨出一個消費者的喜好,但從供應到購買的鏈條還沒建成;三是因為資料分析人才仍然極度匱乏。他說,15年前,很多人認為網際網路是泡沫,今天證明網際網路沒被高估,5年前,很多人認為電子商務是泡沫,但今天中國已經有3億人的電商市場,我們還有什麼理由說大資料只是泡沫呢?聽眾席上點頭頻頻,現實顯然頗具說服力。
正方嘉賓,來自非洲迦納的Simons急於扳回局面,丟擲一個引人思索的問題:“請問,我們現在真的有什麼問題,是靠大資料才能解決,而靠現在技術解決不了的?”他說,大資料不僅分散了人們的注意力,甚至是“危險”的,因為海量資料意味著決策制定將更加“集權化”,而科學本身是應當以人為本,強調自主性的。他以多年前他在一家英國銀行開戶的經歷作為例子:一開始他與銀行客戶經理面對面聊天,對方認為他完全符合開戶條件,可當把他的所有資訊輸入電腦之後,電腦卻拒絕了他的開戶申請,而他至今不知道自己為什麼被拒。“大資料意味著人們將不再運用自己的智慧、問真正該問的問題,”Simons說。“最後我想說,小才是美。”
聽眾們顯然有所觸動,天平似乎又重新傾斜。
最後出場的是反方辯手、日本內閣大臣山本一太。曾是搖滾音樂人的他十分懂得調動氣氛,鄭重宣稱,由於強敵當前,所以也決定臨時變更計劃,改用日語,再度引來笑聲。他為支援大資料拿出的“殺手鐗”是——東京申奧成功的“奧祕”。他說,日本民眾最初對申辦奧運的支援率只有不到60%,但日本政府成功利用社交媒體和資料分析,向公眾傳遞支援申奧的訊息,最終將支援率提升到80%以上。另外,在自然災害頻發的日本,大資料也早已在防災減災上發揮作用。
兩輪交鋒下來,賽程過半,雙方似乎勢均力敵。主持人接著請聽眾來挑戰雙方辯手。一位聽眾挑戰正方,說,你們認為大資料過於龐雜紛繁,反而解決不了問題,那是不是說,當處理資料的計算工具變得足夠好時,大資料就會變得有用? 科學家Howard重複了“一臺電腦論”,強調資料不是越多越好,而是恰到好處才好,但似乎沒能拿出更有說服力的論據。
一位聽眾挑戰反方,問:眼下的大資料熱,是由真實的需求驅動的嗎?還是IT企業的噱頭?決策制定真的要靠大資料嗎?蘇萌教授一語中的(雖然似乎有些偷換概念):“不靠資料,難道靠直覺嗎?”
一位聽眾再次挑戰反方:幾年前愛沙尼亞遭到黑客攻擊,由於該國政府部門和私營部門的資料集中存放,網路攻擊導致該國幾乎全面癱瘓,這個事件是不是說明,大資料會讓網路安全變得更加脆弱?山本回答:的確如此,但各國都已高度重視網路安全,技術進步也會讓這個問題找到答案。蘇萌最後總結道:所有新鮮事物都需要一定的泡沫,才能吸引到更多的投資和關注,最終才能讓真正好的東西沉澱下來。
辯論結束,主持人再度請現場聽眾投票,反方成功逆轉,支援率上升到57.1%。蘇萌與山本興奮地擊掌歡呼。
這場短短的交鋒,顯然只是大資料之爭的一個微小縮影,也無法給出是或非的答案,但足以激發聽眾的思考。正如Howard在發表“失敗感言”時所說,“我們並非反對資料,只是反對大而無當的資料,資料本身當然非常重要”。人類已經並將繼續產生日益龐大的資料,或許不論我們接受與否,大資料時代都已到來。如何利用它造福人類,才是最為關鍵的問題。
原文釋出時間為:2014-01-28
本文來自雲棲社群合作伙伴“大資料文摘”,瞭解相關資訊可以關注“BigDataDigest”微信公眾號