大資料”。這是最新的IT流行語,而原因也不難理解。更快、更深入地解析更多資訊的能力,使企業、政府、研究機構等能夠以一種以前只能想象的方式去理解這個世界。

這些都是事實。不過呢……

還有一種情況同樣也是事實:在爭先恐後擁抱大資料的各種可能性之際,我們或許忽略了大資料帶來的挑戰,比如企業怎樣解讀資訊,怎樣管理資料帶來的政治問題,以及怎樣尋找必需的人才來理解新資訊的洪流。

也就是說,大資料為資料分析的遊戲增添了更大額的賭注。侵犯隱私的可能性增加,在快速變幻的市場中的財務敞口加大,把噪音當真知灼見的可能性增加,把大量金錢和時間用於界定不清晰的問題或機會的風險加大。

如果不明白、不化解這些挑戰,我們就會面臨這類風險:將本來有望強化組織的一切資料變成一種牽扯精力的東西,一種幻象,或者是一場傷筋動骨的權力爭奪。

請允許我更具體地說說這些挑戰。

大資料確實是很好的工具,但誰擁有使用這些工具的技能?

找到有能力使用Hive、Pig、Cassandra、MongoDB或Hadoop等資料分析工具的人才只是整個洋蔥的第一層。沒有幾家公司的內部專家能夠從業務角度證明花錢聘請大資料專家的價值,更不用說對求職者的優劣展開評估。很多管理人員也缺乏基本的數學能力,所以如何找到能夠掌握更復雜統計機制的決策者,也有可能是一種挑戰。

大多數企業都還在摸索大資料的分析方法,冒險嘗試的企業也越來越多。本圖以資料呈現了大資料的投資現狀、用途和所存在的一些問題。

讓事情更加複雜的是,大資料工具還沒有做好大範圍推廣的準備:它們仍在快速演化,大多數高校都沒有教,供應商的支援不夠理想,對使用者靈活性的要求也高於更成熟的工具。考慮到這種情況,尋找合適人才的重要性只增不減。

洋蔥的另一層:要讓大資料發揮作用,程式設計師和分析師還要了解所涉行業的基本情況。比如說,一家制藥企業的資料分析師注意到,近乎實時的銷售終端資料顯示1月份阿司匹林銷量大增,於是他們說,流感愈演愈烈。但在調動銷售資源開展大規模廣告活動並增加產量之前,不妨把當前的銷售型態與過去幾年的情況做個比較。阿司匹林銷量增加也可能是很多人在參加新年前夜的聚會之後出現了宿醉反應。如果分析師不瞭解業務以及應該問的問題,那麼公司就有可能在花了很多錢之後一次次地走進死衚衕。

最後一層是IT安全。如果說很多公司真的沒有能力使用大資料工具,那麼它們肯定也沒有能力保障資料安全。收集到的資訊越多,可能遭到洩露或竊取的資訊也就越多。

資訊即權力,所以很多資訊就是很多權力。

人們常常認為掌握資訊就會在組織內部掌握權力。顯然,不管是誰來決定大資料時代該衡量哪些東西,這個決定者都會積累越來越大的權力。

另外,跨越組織邊界的資訊分享是大資料的屬性之一,它可以顛覆傳統的權力關係。

以一家在加拿大和美國各有一座工廠的公司為例。來自感測器的資料流顯示加拿大工廠出產的發動機擁有97%的可靠性,美國工廠發動性的可靠性只有80%。突然之間,加拿大工廠管理人員在組織內部的地位可能就會升高,讓美國工廠的管理人員感到驚慌。

公司的效益可能會得到改善,但高管必須做好管理內部政治的準備。

再舉一個例子。大資料使人有機會衡量先前無法衡量的東西。如果一家大型零售企業現在可以更快速、更方便地衡量消費者對不同營銷活動(不管是“超級碗”廣告、雜誌優惠券還是報紙廣告)的反應,不同的利益相關者在組織內部的相對地位可能就會發生變化。他們也有可能對社交媒體團隊產生憎恨,因為後者會用點選率資料來證明他們有能力或沒有能力拉動銷售收入。

原先要用幾個月時間來規劃、執行的流程現在可能只需幾分鐘就能評估完畢,將會進一步加劇上述顛覆過程。多年習慣了評估年度銷售業績的人常常很難應付每週甚至是每天的收入資料。按老一套辦法管理的人可能會發現自己已經落伍於新的世界。

有些東西可以衡量,不一定意味著它就應該衡量。

一旦知道資訊即權力,有人可能就會投機取巧,損害公司的利益。

比如說,一家大公司開始以公司被推特(Twitter)提及的次數為指標來跟蹤網站流量,跟蹤結果在高管的推特活動一覽表(dashboard)上持續更新。

一支銷售團隊的經理原先主要是通過貿易展會來獲取線索並最終達成銷售,然而當推特提及次數成為關鍵衡量指標之後,這位經理改變了部門的重點,宣稱“我們要拿下dashboard”。到頭來這個部門可能確實是拿下了dashboard,但這樣一來,它強調的就不是曾經大獲成功的展會,而是沒有優質線索、無利可圖的網站點選量和社交媒體流量。

這些資料怎麼處理?

普通資料庫大約已經存在了35年的時間,所以人們有了很多經驗,這些工具的理解和運用相對容易。相比之下,大資料還在萌芽階段,所以組織、理解其深層意義的技術仍然處在起步階段。

另外,理解如此大規模的資訊也不是一件容易的事情。安全大師布魯斯·施奇納(Bruce Schneier)如此總結很多人的數學能力:“一個,兩個,三個,很多個。”電子表格仍然是很多公司的主要定量分析工具,但它遠遠不足以用來實時衡量某個城市特定時刻道路上的汽車數量,或者是本週聯邦政府在交通專案上的支出。

視覺化對於這類資料可以起到極大的幫助作用,但這個領域仍不成熟,其特殊語言也沒有多少人懂得。

大資料思維的挑戰

在如此大的規模層面上思考問題意味著什麼?我們怎樣才能學會針對主城道路上每一輛汽車、大型連鎖零售店每一位顧客的智慧手機、或配送車上每一個隔夜包裹所發出的資訊提出問題?怎樣才能讓更多的商人學會按統計概率而非偶然事件思考?由於《點球成金》(Moneyball)這本書及同名電影的緣故,其中涉及的方法已經為球迷所熟知。但他們也將記得,這樣的方法是怎樣給一個組織帶來了天翻地覆的變化,並被競爭對手模仿。

從某些意義上講,它要求人們用一種全新的方式打量這個世界。

但優秀管理的原則也適用於大資料領域。在企業能夠利用大資料獲利之前,管理人員必須拒絕迷失在噪音當中,放任它掩蓋客戶、價值和執行這些基本力量。大資料的數量、速度和多樣性可能會顯得陌生,使人很容易在數字海嘯面前暈頭轉向。

所以,堅守紮實分析的基本原則總是至關重要。還要記住,數字可能會告訴你一些以前根本都不知道要問的事情,但數字從來不會自己說話。

作者是賓夕法尼亞大學(Penn State University)斯米爾商學院(Smeal College of Business)教授。

 

via :cn.wsj.com