調查結果顯示,大資料最近的市場表現令人大跌眼鏡。部分由於媒體炒作的影響,許多企業都並未實際瞭解大資料產業價值時就對其進行了投資。之後,預料之中,一份新的分析報告顯示眾企業從大資料上得到的回報比他們預期的少得多,甚至少於他們的投資額。
少到什麼程度呢?根據Wikibon的初步研究結果來看,答案是少得令人吃驚。
果然,Wikibon發現46%的大資料投資者僅從他們的專案中竭力維持了部分的成功,而2%的投資者不得不取消他們的投資並以完全失敗告終。
不過這並不代表大資料最終會不可避免地以失敗收場。
Wikibon指出,大資料投資的失敗原因之一是“許多企業投資像Hadoop這樣的大資料科技卻沒有與這個專案相聯絡的精確可測量的商務應用。”他們僅僅是聽到“大資料”的名字就紛紛往裡砸錢,卻沒想過他們真正期望達到的目標是什麼。這與高德納的分析結果是相一致的。
對於大多數企業來說,大資料就等於Hadoop,而Hadoop的大意被IT人員解釋為“一個無人管理的資料垃圾堆。”而Criteo公司的工程副總裁朱麗恩·西蒙(Julien Simon)稱“大資料經常就僅僅代表著無用的資料。”
如果不知道資料的用途就貯存它,那麼這些資料就只會增加噪音和掩蓋訊號。著名統計學家內特·斯爾文(Nate Silver)假設道:
如果資訊的數量增加至每天2.5*1^18位元組,那麼有用資訊的數量幾乎為零。這些資料大多隻是噪音,而噪音數量比訊號數量增加得快。有太多假設需要被測試,總資料增加得太多了,但客觀實在的資料量是相對穩定不變的。
換句話說,增加更多資料,並不是大資料問題的解決方法,卻通常是問題的起因,而這也是許多公司從大資料投資中得到回報非常少的原因。
Wikibon的研究表明,最好的大資料專案“並沒有被引入IT界,而是為企業運營部門所用,它們通常被用於市場營銷,或用於小型但有策略的案例中。”這些企業會挖掘大資料內行專家,並對他們能用這項技術達到的效果報以切實的期望。
這些專案開始時非常小,但之後就會在最初的基礎上擴充套件開來。
為了避免將不必要的巨資投入大資料專案,最好像上述企業那樣做。所有最好的大資料科技資源都是開放的,所以在購買之前可以先試用,然後再根據各自的需求來選擇和發展最好的技術。