隨著雲時代的來臨,大資料也吸引了越來越多的關注。在以雲端計算為代表的技術創新大幕的襯托下,這些原本很難收集和使用的資料開始容易被利用起來了,通過各行各業的不斷創新,大資料會逐步為人類創造更多的價值。從IT界到、金融界,再到物流界、營銷界,乃至醫療界、教育界,無論是界內界外人士幾乎都已快形成“言必稱雲”、“言必稱大資料”的口頭禪。
但如果真遇到一個“較真兒的”,發出這樣的提問——到底什麼是大資料?大資料到底有什麼價值?我怎樣才能得到大資料價值?是那頭黃色的Hadoop小象?是動輒XXXBIT的高大上資料量?又或者是千萬級別的使用者資訊?那估計很多口口聲聲不離大資料的人可能都言語含糊解釋不清了。
那麼,到底該如何來看待大資料呢?專家馮曉傑表示,大資料單從字面意思似乎不難理解,可以認為是海量級的資料,但是在這海量級的資料究竟意味著什麼,這在很多業內外人士的概念裡還純在著一些認識誤區。
大資料誤區一:只要大就好
如今,很多人提起大資料,如果不提上幾嘴“日處理資料量XXGB,上傳圖片XXGB,併發數XXX”“Hadoop叢集擁有XXXX節點,總儲存XXPB”諸如此類的技術語言,都很怕別人覺得自己不專業。但是,難道真的只有資料大了,才能達到大資料的登峰境界?才能數人合一地達成大一統的目的?
馮曉傑表示,資料如果僅僅是大那是沒多大用處的!就好像資金的意義在於如何使用週轉一樣,資料大了,但不使用,讓它孤零零地偏安機房一隅,那它就不是大資料了,而是有點“敗家子”的意思。
比如不少傳統的入口網站,基本上就處於“坐擁金山卻無福消費”的境況。每天上億的使用者量,卻只是簡單的廣告呈現,沒有通過對資料的分析產生更多價值。
大資料誤區二:只有技術大牛才懂大資料
雖然很多人口口聲聲離不開大資料,但是真問他到底懂多少時,其中一部分人可能會說:“我就是懂些皮毛,真正技術層面的大資料我也不懂,你還是問那些技術大牛去吧,他們才真懂。”
馮曉傑表示,其實這樣的觀點並不全對。比如諸葛亮很懂兵法,他知道該在哪裡擺陣,該在哪裡伏兵。但是,他不必知道關羽是如何耍大刀,也不必知道張飛的丈八蛇矛在打仗時是扎還是砍。
其實,對於大資料的應用更多的是一種戰略能力,而非細節的執行技能,這種能力是可以幫助決策者能從無盡的資料裡看出商機看出價值,從而為企業帶來更高的利潤。而作為決策者並不用太關心在技術細節層面,大資料到底怎麼技術生成,又是如何理順提升使用者體驗的。
大資料誤區三:是個公司都得上大資料
馮曉傑表示,雖然大資料固然是個香餑餑,但不是所有人都能消化得了,或者說並不是所有都有上大資料的必要,而是要衡量企業的現狀,看清楚主次矛盾,或是要考量好投入產出的回報率,大資料並不是適合所有企業的現狀。
比如,對於中小型網站來說,一上來就盲目追求先進“高大上”的技術架構,那就有點“宰牛刀殺雞”的意思。對於這類網站,首要考慮的是商業運作模式和推廣,只有等到使用者量飈升後,再去考慮技術升級這種大事兒。
再比如,在GMIC上,Evernote的CEOPhilLibin就明確表明不帶大資料一起玩兒,自己產品的商業模式就是向使用者收費,讓他們甘心為產品體驗付費。
馮曉傑舉例表示,如同一個雙選題:A.日登陸使用者1000人,架構完全參照美國亞馬遜從不當機;B.日登陸使用者10萬人,每天因為高併發不得不當機三次。你會選什麼?
大資料誤區四:我就要海量資料
自從大資料概念火了以後,不少企業在遇到問題的時候,總是會情不自禁的就會想到“是不是我的資料量不夠?”“是不是如果有了海量的大資料就能變得更好?”其實,這又是陷入了一個誤區。
這又回到了大資料價值和金錢價值的類比概念上。比如用搜尋引擎搜尋一下“存款貶值”,那麼很快就可以發現類似這樣的資訊:“五十年前的百萬變13塊”,“一萬元存一年賠19元”,顯然,不流動的錢,是越放越沒有價值,而基數越大,可能導致的損失就越大。
金錢如此,大資料亦然。只有像比特幣玩家們一樣,不停地使用資料,並以無比的熱情挖掘資料背後的關係和價值,才能如滾雪球一般,使資料之間的相互關係更豐富更完善。同理,對於企業的大資料來說,只有充分利用大資料,讓大資料充分流動起來,不斷的實現增值效果,那麼才有機會更大的釋放大資料的能量。
因此,馮曉傑指出,對於企業決策者來說,看待大資料必須有一個清醒的認識,當在腦袋發熱準備花大價錢上大資料之前,都一定得先想明白透徹了:“我真的需要大資料嗎?大資料真的能為我所駕馭嗎?”