“大資料就像青少年性關係一樣……”,儘管我也不知道這個關於大資料的比喻引用自哪裡,但還是有人將一個有趣的研究指派給了來自杜克大學的丹·艾瑞里(Dan Ariely,經濟學家,來自世界著名大學(MIT)麻省理工學院斯隆管理學院的年輕教授。他是目前行為經濟學和電子商務領域中十分活躍的國際知名學者。Dan Ariely於1991年在以色列特拉維夫大學(Tel Aviv University)獲得心理學學士學位,1994年在美國北加州大學獲得認知心理學碩士學位,兩年後在北加州大學獲得認知心理學博士學位。1998 年,Dan Ariely在著名的杜克大學獲得了營銷學博士學位,同年,年輕的Dan Ariely取得了MIT的助理教授席位。他現為MIT斯隆管理學院的管理科學(Luis Alvarez Renta)講座教授)。
今天,我想在這裡談一談關於大資料這方面的話題:它到底為何方神聖?它如何提升決策?我們應該怎樣利用它?
大資料到底有什麼過人之處?
▶它不僅僅“大”,它的規模龐大。
▶它不僅僅“大”,它具有不同的格式——文字、數字、影像。
▶它不僅僅“大”,它對資料集的處理比較困難。
▶它不僅僅“大”,向從中決定出原因/影響也很難。
這裡有一個來自我們的大表哥——IBM,關於大資料的形象比喻:
大資料正在以驚人的速度、體量和多樣性,從各種各樣的資源中極速駛來。如果向從大資料當中提取出你人為有價值的資訊,那麼你就需要優化處理能力、分析能力以及相應的技能。
接下來,讓我對此進行深入的挖掘。
速度
大資料正在以飛快的速度朝你走來,尤其是當越來越多的裝置與物聯網連線時,市場營銷人員變得更加善於從類似Facebook這樣的社交網站整合資料資源。
規模
我們正逐漸沉沒在資料的海洋裡——資料來源於我們的銷售渠道,來源於社交媒體渠道,來源於我們的銷售隊伍,來源於外部的CRM系統,來源於我們的簡訊,來源於市場調查,來源於產業研究···物聯網從我們彼此的家中,從我們相互聯絡的智慧手錶、活動追蹤裝置以及醫療裝置等裝置中,帶來了大量的資料資源。
如果我們想緊跟這些不斷彙集的大量資料資源的話,我們需要制定卓越的計劃方案把這些資料組織到統一的資料庫當中,還得需要知道如何儲存資料,用什麼來進行儲存,並且懂得如果和資料庫之間進行通盤協作,更不用說如何讓資料變得更有利用價值。
資料的收集並不會產生效益,除非你對這些資料加以分析和利用。亞馬遜的S3服務系統大大降低了資料儲存的成本,但是儲存百萬位元組的資料所需的花費還是相當昂貴的。
多樣性
對於大資料而言,多樣性是它最具有挑戰性的一個特徵——尤其是消費者產生的由文字和影像構成的非結構化資料,其體量之巨大,不得不讓我們考慮這些資料的多樣性特徵。據IBM估算,80%的資料都是非結構化的,和結構化資料不同的是,處理非結構化資料的工具到目前為止,數量還是很有限的。
這裡,我也想用來自我個人的一個大“V”來描述大資料的特性——真實性。有太多時候,我們總是對自己收集到的資料持有一定的懷疑態度,原因出於以下幾個方面:
我們是否將我們的言辭賦予了準確的情感表達?
資料本身是否正確呢?
在資料收集的時候是否有考慮維持其結構?資料是否可能被損壞或者錯位,導致變數變得模糊不清?
資料是否值得信賴——比如,消費者反饋的資訊是否準確?
資料是否具有代表性?我們是否曲解了資料的含義?
使用大資料提高決策制定能力
既然我們瞭解了關於大資料的一些基本概念,也正在面對著它的挑戰,那麼現在讓我們來討論一下使用大資料來提高組織機構的決策制定。
大資料不會解決你的麻煩,但是它可以作為讓你找到解決辦法的一種工具。
下面就是一些非常棒的使用方式:
提供對客戶的洞察
如果恰巧在消費者有具體需求的時候獲得了它們自己想要的產品或者服務的時候,並且以他們認為合理的(而非低廉)價格進行推薦,那麼這的確是一種可以讓企業獲得成功的手段。
大資料可以為我們提供類似上面這種對消費者的瞭解。比如,與情感分析不同的是,社交網路平臺給企業提供了大量的可供我們瞭解消費者的資料資訊,其中包括未得到滿足的需求(這代表對新產品的需求)還有客戶服務中存在的困難。
對於這些你所獲取的對消費者的洞察資訊,你不能停留於這些普通對話的表面,你要從局外人的角度找到最獨到的見解。我曾經和這樣的公司一起共事過,當公司遇到了某些消費者的消極評價時,雖然這種評價不會經常發生,但是公司還是駁回了消費者的消極評價。這種行為你可以認為是對的,或者其實他們的做法也不完全正確。如果消費者的這種評價預示著問題的冰山一角的話,那麼這種評價對於你的公司而言就是一種前兆——你的公司可能正在或者即將面對巨大的麻煩。
和駁回消費者零星幾個的消極評價相比,你還不如對這些評價進行深入的調查。即使只有那麼零星幾個消費者抱怨,那麼局勢也會因此失控,這時候你需要做的就是快速響應,你的快速響應可以讓申訴人得到一定程度的滿足,並降低可能引起的負面影響。
提供有目的性的交流
如果你和客戶或者消費者之間的交談不歡而散的話,沒有什麼會比這種後果更加讓人感覺失敗的了。舉個例子,當我在亞馬遜網站尋找一雙新的登山靴時,我喜歡從網站的客服那裡得到一些建議,但是在我已經買完一雙靴子之後,如果我還是不停的收到他們的推薦資訊的話,我就會感到不開心。客服的這種做法只會讓我覺得,作為一名消費者,我對亞馬遜而言無足輕重——因為客服根本就沒有把我說的話放在眼裡。
同樣類似的事情在LinkedIn上面也時有發生。我會從某些人那裡得到關於如何為我開拓業務的服務。作為一名專業的市場營銷人員,我也會同意某些人向我提供幫助,因為我不得不僱傭一些人將我推向市場。你所需要做的就是粗略的看一眼我的個人資料,發現我也是一名專業的市場營銷人員。
如果你和消費者或者客戶之間進行一次目的性很強的談話的話,這樣的做法會顯得有些狡詐,尤其是當你的資料本身都是從各種資源中獲取而來。如果想結合對於消費個人的瞭解,還得需要將不同的資料庫資源進行融合。在這個場合,我們就需要藉助社會化登入來幫忙——社會化登入是融合資料困的關鍵所在,它可以將社交資料整合到一個單獨的記錄當中,並且從中可以讓我們得到對客戶更好的瞭解。
優化績效
大資料產生的洞察力可以優化企業績效。
這裡還是舉例說明。一家救護公司會根據救護車請求資料進行資源分配和員工的安排,目的就是為了減少救護車出動的反映時間,這樣就可以降低死亡人數並減少客戶的申訴,因此在沒有增加任何成本的前提下就可以提高客戶的滿意度。
電力公司使用資料洞察進行需求管理,減少了對於新建的,造價昂貴的發電站的需求。
遊樂場使用資料進行人員分配和價格的調整,一次來減少高峰負荷時段的人流。
航空公司也使用同樣的手段。
利用大資料
想要獲得洞察力,那麼就從資料的收集開始吧。
評估為決策制定而輸入的資料的潛在資源。IBM為我們提供了一張圖表,向我們展示了資料的來源:
雖然你擁有資料,但是這並非意味著你應當保留資料或者將他用於決策的制定。同樣的,你不收集資料,你也無法分析資料。這是一件關乎成本效益的事情——只有當潛在利益比成本重要的時候你才會去收集資料。
比如,當使用者在網站進行賬戶註冊的時候,你向他詢問大量的個人資訊,這種做法也許不錯,但是這的確會嚴重的降低想來網站註冊賬戶的人數。當你發現擁有這些個人資訊的價值大於註冊率的的降低的時候,那麼你完全可以這樣做。如果你已經有了這些資訊,然後又再次尋求的話是一種浪費。
資料清洗
我認為大多數的資料分析師都錯過了這一步——務必保證你所擁有的資料是清潔的。垃圾資料就等於無效輸出。
我經常抽查我的資料,想發現當中是否有看起來不對勁的地方。這樣做,對於機器分類中可能存在的不準確的非結構化資料而言,顯得異常重要。
接下來,我會把資料作為一個整體看待,看看當中是否存在資料問題。
資料集合並
下一步,我將會使用幾種關鍵資訊,可能是客戶編碼、郵件地址、電話號碼或者一些其他型別的唯一識別碼,合併資料集。
資料分析
在這一步,最後你會發現大資料的價值。然而你一定要多加留意,否則你會因為胡吹亂扯而前功盡棄。有了充足的資料之後,你必定會它們之間的相互關係,並且它們當中的大部分資料都是無效的。那些看起來可能無效的資料其實是存在因果關係的。
你是否還記得,超級碗的廣告顯示所有的孩子都在城市代表隊贏得超級碗比賽之後的9個月出生,這是一種內在的相互關係還是因果作用的結果?
我認為培訓市場營銷人員在大資料分析方面的能力特別重要,因為我真地相信你需要懂得隱藏在市場營銷背後的概念,這樣才能在大資料分析當中存在的無效關係中辨認出重要關係。
編譯丨化學資料聯盟-醜燦