資料之美不在大,在乎實效之間也

程慧發表於2014-05-29

《大資料時代》作者維克托·邁爾·舍恩伯格用四個v的特徵描述,給大資料做了一個定義:一是資料體量夠大(volume); 二是資料型別夠多(variety);三是資料價值密度低(value);四是具有實效性(velocity)。那麼對很多傳統企業來說,所擁有的“不夠大”,“不夠多”的資料,是不是就沒有參考價值了?

近日看到一個解放戰爭中“小資料”助力打勝戰的故事。遼瀋戰役打響後,林彪要求每天深夜都要進行軍情彙報,由值班參謀讀出各個縱隊、師、團用電臺報上來的當日戰況和繳獲情況,包括每支部隊殲敵多少、俘虜多少;繳獲的火炮、車輛多少;槍支、物資多少……某一天,林彪就胡家窩棚戰鬥的繳獲,問出了三個問題:“為什麼那裡繳獲的短槍與長槍的比例比其他戰鬥略高?”“為什麼那裡繳獲和擊毀的小車與大車的比例比其他戰鬥略高?”“為什麼在那裡俘虜和擊斃的軍官與士兵的比例比其他戰鬥略高?”由此林彪司令員得出了敵人的指揮所就在這裡的結論。

這堆資料之小、之雜亂無序,可集中挖掘後,也分析出研究物件的內在規律,也能起到大作用。

如何用好大資料?

首先資料意識很重要。不用糾結於是不是大資料,先把資料建立起來。據說林彪“從紅軍帶兵時起,身上有個小本子,上面記載著每次戰鬥的繳獲、殲敵數量”。我們已經進入了一個一切都可以被資料化的年代,微博是資料化了的思想和觀點, 簽到網站是資料化的位置;地圖是資料化的地理場景。而無處不在的感測器,更是讓量化一切變成了可能。當這個世界被植入了感知、計算、通訊,任何人/物都會成為一個資料來源。一切狀態和行為都能量化,能夠在資料空間中被操作。

其次從商業社會的角度理解資料。大資料在各行各業衍生出各據應用。谷歌、亞馬遜等公司是發展大資料技術的主要推動者。據《華爾街日報》報導,亞馬遜於2013年12月獲得“預期遞送(anticipatory shipping)”新專利。在我們點選“下單”之前,亞馬遜能把預遞送的商品存放在快遞公司的寄送中心或卡車上。大資料發展到今天,技術已不是問題。我們不僅是在資料上下功夫,更關鍵的是要與現實生活相結合。種種資料,只有及時高效地挖掘利用,能夠形成預測,能夠助於商務決策,才是關鍵。

最後要懂得借力而為。對於大多數企業來說,企業自己建設IT系統,自己從頭開始積累資料,費心費力費錢,且收效甚微。有三種解決方案,一種聯合行業或價值鏈上下游共同開發,促進企共同發展;另一種是做外包,把IT建設外包給合適的服務商;而最好的方式是藉助一個好的平臺,節省自己開發大資料的成本,企業將所有精力投入到客戶開發上就好。在這方面,運營商無疑有著天然的優勢,擁有大量使用者相關資料,而且準確度高;而在通訊管道基礎上搭建“雲+大資料”的基礎設施,能讓平臺上的各使用者群體開啟“開關”即可使用。
資料不在大小,能夠助於運營發展就有價值。推動大資料研究的動力還是來自企業的經濟效益。資料之美不在大小,而在於是否真的能為企業帶來好處。

相關文章