貴州大資料培訓 《一步一步教你分析消費者大資料》

weixin_34146805發表於2017-12-18
7001910-1aab0e73820147c3.jpg

        做過面向消費者產品解決方案的同學都知道,每個專案開始前,客戶都會提一些要求或者對現在營銷狀況的顧慮,比如我們想了解一下我們潛在消費者是誰;怎麼發優惠券效果最好;或者,我們應該推出什麼樣子的新產品,能夠贏得消費者口碑和青睞。在量化決策分析法中,這一系列的前期需求,我們把他稱作為:客戶需求或未來期望。

       接下來,你需要了解該問題的現狀,比如現有產品或服務的消費者是怎麼樣的,以前發的優惠券效果怎麼樣,現在市場的銷量趨勢如何等等。

       當了解了客戶需求和現在的現狀後,我們需要慢慢抽絲剝繭,找出解決方案,填補這個空檔。

       一般來說,沒有任何方法論或者經驗的諮詢員或者分析師聽到客戶的這些期望後,他們會開始不知所措,無從下手。他們完全不知道該從哪個角度切入,收集哪些資料,做哪些假設,用什麼方法分析。

​      其實像這類問題是有方法論的,我們可以用四步循序漸進的方法來搭建現狀與未來的橋樑。

7001910-cdd72398d88b9b7c.jpg

第一步:描述性分析-What

7001910-236e59996a4d4140.jpg

        發現問題。我們可以用看病的場景來類比下,病人去看病,說最近不舒服。於是醫生讓病人進一步描述一下怎麼不舒服。這裡也是一樣,拿優惠促銷的案例來說,我們會先了解客戶以往有沒有做過類似的促銷案例,什麼時候做的,效果怎麼樣。經由這些的問題產生一系列的KPI。

KPI產生的方法有以下幾種:

1)我們提問,客戶解答

2)從客戶公司資料庫獲得資訊(SQL)

3)從外部資料獲得資訊(第三方資料加強)

4)競爭夥伴資訊

5)政策資訊

6)語義分析

7)其他

獲得KPI的工具:

1)問答(座談,電話,Email,簡訊,問卷)

2)資料庫(SQL)

3)Excel

4)R,Python等軟體

5)網站搜尋資料

6)自然語言學習

7)其他

分析這些KPI變數:

7001910-d46001c6c7eaf63f.jpg

       這些KPI可以是絕對數,百分數,也可以是指數。可以是過去不同時期的對比資料,也可以是不同分組(如:人群分組,模式分組)的對比資料,或者和競爭對手的對比資料等。通常KPI分析的方法有:

1)單變數分析(univariate)

2)雙變數分析(bivariate)

3)多變數分析(multivariate)

4)假設驗證(hypothesis)

5)簡單建模(clustering分組)

經過對這些KPI的分析,可以幫助我們形成:

1)已有消費者人物畫像

2)潛在消費者人物畫像

3)忠誠客戶畫像

4)消費者價值分組

5)其他

第二步:診斷性分析(why)

7001910-e7e4a4864d987c75.jpg

       回答問題。我們同樣用醫生看病的例子來類比一下,當醫生問完病人問題,通過問診,X光等等,醫生開始利用自己掌握的知識來對病人的病情做出診斷。

放到分析法中,這一步通常我們需要:

1)瞭解因果關係

2)瞭解各因素間敏感性如何

       我們需要了解是由哪個原因,或者哪些原因造成了現在的市場現狀。比如在前一個階段,我們得到了50個非常有用的KPI,通過因果關係分析,我們確定了,其中有10個KPI起著重要的作用。結下來,我們會問,這10個因素中,每個因素單獨的貢獻是多少,有些可能非常高,有些可能相對較低。那這個問題,我們可以通過建模來得到每個因素的貢獻大小,同時模型還能起到剔除高相關變數的作用。還有一種用到模型的原因是,當因素達到上百,上千個的時候,很難用傳統方法在如此多的因素中,甄別出最有用的事那些,這種情況下,也需要用到模型來幫助選變數,最後一個原因是我們可以甄別這個因素是正向促進因素,還是反向促進因素。

通過建模的結果,我們可以得到以下以下關於消費者的模型:

1)忠誠度模型

2)滿意度模型

3)價格敏感度模型

4)歸因模型

5)客戶流失模型

產生這些模型背後的演算法有:

1)線性迴歸

2)邏輯迴歸

3)決策樹

4)時間序列

5)Randomforest,boosting,SVM,PCA等等

7001910-cc21501594bdd8a8.jpg

第三步:預測分析

7001910-3299097f738a7ba4.jpg

預測正確的時機,得到先發制人的營銷效果。有了第一步和第二步的準備,我們需要預測一下,如果我做一些調整,將會有什麼變化和影響。

用到的模型有:

1)意向打分模型

2)品牌忠誠度打分

3)購買渠道偏好模型

4)觸媒使用習慣

6)銷量預測

5)生存分析模型

       比如:意向打分模型。我們發現,如果用現有的因素,消費者會轉換的傾向可能是60%,但是如果我對一些因素做了一些調整,如:我給現有客戶多發2個廣告,客戶會購買的可能性上升到65%;如果,給客戶多發5個廣告,客戶會購買的可能性上升到85%。通過這樣的調整,我能夠預估,將來的廣告成本,或者轉化帶來的收入等。

       又比如:通過時間序列模型,我們可以預測到明年購買某品牌車型的消費者有10萬人,這樣對明年的生產計劃和營銷計劃就能有一個前期的應對準備。

7001910-377f32528fafd9e5.jpg

第四步:決策分析應用

7001910-8ad5e86a63c11e84.jpg

1)提供戰略推薦

2)優化

3)市場模擬

4)A/B測試

7001910-7b72663baedc37b2.jpg

        第三步的例子提到多發2個廣告,轉化率為65%;多發5個廣告轉化率為85%。那麼如果多發3個?多發4個廣告,結果又會如何呢?學術界一直在尋找最優化完美的答案來解決這個問題:我到底發幾個廣告,才能讓我的利潤達到最大化呢?

我們都知道在做迴歸模型的時候,有以下幾個假設條件:

1、隨機誤差項是一個期望值或平均值為0的隨機變數;

2、對於解釋變數的所有觀測值,隨機誤差項有相同的方差;

3、隨機誤差項彼此不相關;

4、解釋變數是確定性變數,不是隨機變數,與隨機誤差項彼此之間互相獨立

5、解釋變數之間不存在精確的線性關係,即解釋變數的樣本觀測值矩陣是滿秩矩陣

6、隨機誤差項服從正態分佈

       實際上,現實生活中很難達到這種理想的狀態,而且最大化這個概念,從數學角度講,會涉及到優化求極值的問題,很多情況下,我們實際上求到是區域性優化(localoptimization)的解,而不是全域性優化(globaloptimization)的解。

       所以在這種情況下,管理學中衍生出了市場模擬方法來決定最後方案,最有名的一個方法是沙盤模擬,但是這些模擬往往到了真正落地的時候,又會和之前的結果有差距。

       所以近些年來,越來越多的公司選擇做A/B測試。當你對幾個方案沒有很大的把握,或者對預測結果不是特別自信的時候,A/B測試的出現,解決了這些顧慮。最近的一個成功的案例是Amazon通過A/B測試的方法,把“order”從賬戶欄,放入了主頁的選單欄,為公司帶來的非常可觀的營收增長。

A/B測試需要注意的是:

1)樣本的數量

2)人群的選擇

3)時間的跨度

4)顯著性統計

        整個決策分析法即是階梯又是一個閉環,根據實際的市場反應,再進行進一步的分析與迭代優化。

        讀完整個量化決策分析法後,你應該對以消費者為核心的大資料解決方案有了一定的思路框架,接下來我會定義更新每個步驟需要的方法論,技能,注意點,案例。

感謝你的閱讀,希望你有收穫。

End.    本文來自: http://www.gycpda.com

相關文章