大資料很時髦,但企業如何操作,如何落地,才是真正要面對的,好在現在我們看到很多朋友開始思考這樣的實操性問題,本文將從大資料產品形態角度幫助我們理清一些概念。

嗨,朋友,看到這個標題請先別主觀排斥,跟你一樣,我也反感動輒亂談大資料,為了後續的溝通愉快,先做下這裡的“大資料“指向,特指符合4V特點的大資料,即:

1,資料體量巨大;

2,資料型別繁多;

3,價值密度低;

4,處理速度快。

所以,本文的“大資料”既不是有些人口中的海量資料,也不是非結構化資料,更不是什麼相關與因果,這裡不談什麼是大資料,只談談大資料的產品形態與商業邏輯,拋磚引玉,期待交流。

一、大資料的產品特性

顧名思義,“大資料產品”應該是基於大資料而設計出的產品,那麼理應符合大資料的特點,畢竟基因在那,那麼回顧下大資料與(傳統)資料有哪些具體區別。

(傳統)資料是通過問卷調查收集資料,或者是已儲存的歷史經營資料,比如財務資料、銷售資料這些,至於資料量級,可能就是一臺server的儲存級別。

而大資料是海量,這個海量並不是某個時間斷點的量級總結,而是持續有更新,持續有增量,那麼就決定了可以”製造”出大資料產品的應該不是傳統企業,而是類似電信、銀行、微博這樣的平臺級機構,或者依附於平臺級企業的第三方機構,亦或者是更巨集觀層面的政府管理機構。

這些機構擁有大量使用者,可以源源不斷的產生UGC資料,因此儲存和計算成本必然會隨之上漲,也就決定了大資料產品的甲乙方級別,屌絲可能會被無情的淘汰出局。這些資料不僅僅是數值型的結構化資料,還包括文字內容、圖片、音視訊等非結構化資料。

在處理速度上,(傳統)資料使用excel或者spss,前期有嚴謹的方法論,後期有完善的分析處理過程,從資料的收集到最後報表/報告的產出,這個週期可能在至少一週以上,而大資料因為有了hadoop/storm等IT技術的支援,在處理速度上可以保證在小時級延遲,甚至更快。

這裡需要補充一點的是,大資料產品是否要快速計算?個人覺得應該是,這裡的快速是相對快,不一定非要實時,畢竟在收集、儲存、計算上花了更多的成本,策略如果不及時發現,也對不起那些叢集啊。

那麼是否說大資料就一定比(傳統)資料好了?不一定,引用祝建華老師《文科教授眼中的大資料》裡的一段話,“理論上講大資料指的應該就是總體資料。但實際上,由於技術、商業、保密和其它原因,除了少數大資料的原始擁有者,對於絕大多數的第三方來講,現在大家講的大資料,基本上都不是總體資料而是區域性資料。注意,這種區域性資料,哪怕佔了總體的很大一個百分比(70%、80%),既不是總體資料、也不是抽樣資料。因為哪怕是缺了10%、20%的個案,區域性資料跟總體也許就有很大的差別。”

所以在總體代表性上,(傳統)資料可以較好的代表整體,而大資料可能會出現偏差。但是,這個偏差並不影響大資料產品的商業應用,舉個例子,微博上每天都有各種口碑和輿情,如果涉及某個企業的負面輿情突然趨勢走高,即使在不能代表總體的情況下,你能認為這個態勢不值得警惕麼?當然是不能。並且,大資料產品對使用者的要求更高了,不光關注活躍的資料,還得關注沉默的資料。

由此,大資料產品所具備的特性應當是:

1、資料量級更多;

2、資料處理速度更快;

3、資料型別多樣;

4、使用者要求更高。

那麼,大資料產品究竟長啥樣?

二、大資料的產品形態

先說一個親身經歷,在家收看好聲音導師考核的汪峰場,之前一直很期待這場,畢竟汪峰的風格理念偏重社會觀察,偏重人文洞察,但看到快一半的時候,卻發現很乏味,想換臺,沒有那英那場更黏我,如果說看上一場臉部肌肉是鬆弛的話,那這一場則是緊繃的,”上蒼、思念、回憶、故人、淚水….”當這些碎片詞語不斷的充斥在我的耳邊時,真的不覺得這是一個娛樂節目,一個比一個悲涼,我的訴求很簡單,像看周星馳無厘頭電影一樣,開心一下足矣,哪怕沒有任何的教育意義。

隨後我發了一條微博吐糟,引來眾多附議。我想這應該是不少受眾當時的心態,但不代表對汪峰場的整體評價。那麼,試想一下,如果你是好聲音的競爭對手,在此刻很實時的洞察到了使用者的心情反饋,再通過合適的路徑傳遞出營銷資訊,受眾是否會換臺?答案是未知的,但想象空間是巨大的。

這個場景很恰如其分的給我們描繪出了大資料的產品形態。首先他需要在平臺級機構(微博)上監控海量資料(微博內容),這些資料是非結構化的,通過實時計算獲得洞察(擁有不滿情緒的是少量群體還是大量群體,是真實聲音還是噪音汙染),並快速應用(推送營銷資訊)。

這樣的例子還有很多,特別是在營銷環境裡,受眾的情緒不是線性穩定的,可能十分鐘前還是心情愉悅的,而十分鐘後,則是心情緊張的,不利於接受你的品牌資訊並形成記憶,這些情緒的變化是隨機動態的,因環境的變化而隨之變化。還有哪些屬於大資料產品呢,僅以我所瞭解的網際網路領域為例,DSP、RTB、推薦系統,另外就是巨集觀的情報系統了,比如聯合國的全球脈動專案。

三、總結

綜上所述,大資料的產品形態應該是,執行在平臺級機構之上,通過對持續性海量增加的多結構型別資料,進行快速計算產生策略,結合使用者的經驗認知及時應用,進而產生價值形成商業閉環,一切不以此為特性的大資料產品都是耍流氓!

by:@資料探勘_PHP