基於網站的使用者行為分析

jingxianli0922發表於2014-12-03

誰在使用我的網站——使用者行為分析

前面根據使用者的特徵對使用者做了分類,設定了一些常用的使用者指標和值得關注的使用者指標,基於這些分類使用者指標的分析可以發現使用者運營和推廣中的諸多問題,其中活躍使用者和流失使用者的定義中已經用到了與使用者行為相關的指標,這裡重點介紹常用的使用者行為分析指標以及基於使用者行為的分析。

如們以網站的使用者為主體去理解點選流資料,其實它記錄的就是使用者在網站中的所有行為資料。培訓專家餘世維在講座中常說:行為決定習慣,習慣決定性格,性格決定命運。古語也有類似的話:積行成習,積習成性,積性成命。雖然不能說從使用者在網站的行為就能判斷使用者的性格甚至命運,但如果要從使用者在網站的行為中判斷使用者對網站的期望和喜好還是可以的,關鍵在於如何處理和分析這些行為資料。

每個使用者行為指標的分析價值

點選流資料記錄了使用者在網站的幾乎所有行為動作,衍生出許多行為指標,有些指標是所有網站都統一的,比如訪問頻率、平均停留時長等;有些指標根據網站的特徵定製,比如電子商務網站的消費行為、社群網站的內容釋出行為和社交媒介的資訊互動行為。我習慣將使用者的行為指標分為三大類,即黏性活躍產出,每個分類可以包含多個行為指標來共同衡量使用者在這三類中的行為表現,進而區分使用者的行為特徵,對使用者進行分類或者綜合評定,如圖6-7所示。

 

圖 6-1    使用者行為分析分類指標[z1] 

使用者行為指標中的黏性(Stickiness)主要關注使用者在一段時間內持續訪問和使用網站的情況,更強調一種持續的狀態,這裡將“訪問頻率”和“訪問間隔時間”兩個指標歸到了黏性的分類;活躍(Activity)則更多地針對使用者每次的訪問過程,考察使用者訪問中的參與度(Engagement),所以對統計期中使用者的每次訪問取了平均值,選擇“平均訪問時長”和“平均訪問頁面數”來衡量活躍;黏性和活躍從使用者的訪問情況衡量使用者可能創造的價值,可能是顯性也可能是隱形,如品牌、口碑等,但產出(Outcomes)直接根據網站的業務衡量使用者創造的直接價值輸出,如電子商務網站可以選擇“訂單數”和“客單價”,一個衡量產出的頻率,另一個衡量平均產出價值的大小。

使用者行為分析注意點!

在統計使用者行為指標進行分析時,需要注意選擇合適的時間段,時間段的長度不能過短,不然無法體現使用者長期和持續性的行為特徵,黏性指標的分析會不準確;同時短期的使用者行為也會誤導對使用者整體特徵和價值的判斷,有可能使用者在該段時間內極度活躍或者極度低調,也可能使用者在短時間內創造了高產出,但從長期看使用者創造的價值並沒有那麼高。

使用者行為指標統計的時間段可以根據網站業務特點和使用者的行為密度進行選擇,對於一般的網站,建議每月統計一次比較合適,可以針對某些使用者或分類來比較每月的行為指標資料的變化。

根據需要,可以創造其他的使用者行為分類,也可以基於這三類,每個類別新增不同的行為指標,前提是每個行為分類能夠體現其分析的價值,並且每個分類下的指標可以有效地衡量這個分類的績效表現,儘量保證分類和指標分析上的獨立性,不存在作用的重疊。比如,在黏性使用了訪問頻率,訪問次數越多相應的總的訪問頁面數(Pageviews)也越多,如果在活躍中選擇總的Pageviews,指標間就存在相互的關聯性,進而對分析結果產生重複的影響,所以這裡選擇每個訪問的平均訪問頁面數來保證指標的獨立性。基於行為分類和指標的獨立性,就能體現出不同的分析價值。

使用者行為分析還有一種更簡單的方法——RFM分析,僅選擇三個指標:

w   最近一次消費(Recency)

w   消費頻率(Frequency)

w   消費金額(Monetary)

RFM分析原先用於傳統營銷、零售業等領域,適用於擁有多種消費品或快速消費品的行業,只要任何有資料記錄的消費都可以用於分析。在網站分析中電子商務網站可以直接套用,其他網站也可以基於RFM的分析思路進行修改後使用。

提取相關資料之前,首先需要確定資料的時間跨度,根據網站銷售物品的差異,確定合適的時間跨度。如果經營的是快速消費品,可以確定時間跨度為一個季度或者一個月;如果銷售的產品更替的時間相對久些,如電子產品,可以確定時間跨度為一年、半年或者一個季度。因為RFM也是基於使用者持續行為的分析,所以不建議獲取短時間內的資料。

其中最近一次消費(Recency)取出來的資料是一個時間點,需要計算與當前時間的間隔,單位可以是天,也可以是小時;消費頻率(Frequency)這個指標可以直接對每位使用者的消費次數進行計數得到;消費金額(Monetary)這裡取的是該時間段內每位使用者的消費總額,通過相加(SUM)求得。獲取三個指標的資料以後,需要計算每個指標資料的均值,分別以AVG(R)、AVG(F)、AVG(M)來表示,最後通過將每位客戶的三個指標與均值進行比較,可以將客戶細分為8類,見表6-1。

表 6-1            RFM分析使用者分類

訪問間隔

訪問頻率

消費金額

客戶型別

é

é

é

重要價值客戶

é

ê

é

重要發展客戶

ê

é

é

重要保持客戶

ê

ê

é

重要挽留客戶

é

é

ê

一般價值客戶

é

ê

ê

一般發展客戶

ê

é

ê

一般保持客戶

ê

ê

ê

一般挽留客戶

注:“é”表示大於均值,“ê”表示小於均值

表6-1中,我們可以認為當消費金額大於均值時該使用者能夠創造較高價值,因此是網站的重要使用者;訪問頻率高於均值,使用者訪問比較持續,應該保持這種持續性,而訪問頻率過低的使用者需要提升他們的訪問頻率,屬於需要發展的使用者;最近訪問間隔從某種程度上反映使用者流失的傾向,間隔時間越長使用者流失的可能性越大,對於這類使用者需要重點挽留。

RFM模型包括三個指標,無法用平面座標圖來展示,所以這裡使用三維座標系進行展示,其中X軸表示Recency,Y軸表示Frequency,Z軸表示Monetary,座標系的8個象限分別表示8類使用者,根據上表中的分類,可以如圖6-8所示進行描述。

 

圖 6-2    RFM分析使用者分類三維圖

原始的RFM分析只能分析有交易行為的使用者,而對訪問過網站但未消費的使用者由於指標的限制無法進行分析,這樣就無法發現潛在客戶。所以在分析電子商務網站的使用者時,由於網站資料的豐富性,不僅擁有交易資料,而且可以收集到使用者的瀏覽訪問資料,可以擴充套件到更廣闊的角度去觀察使用者。

基於使用者行為指標的使用者分佈

基於上面使用者行為指標的統計結果,可以結合一些圖表來表現每個行為的使用者分佈情況。Google Analytics上面在使用者行為模組中對新老使用者佔比、訪問頻率和間隔、訪問時長和深度的分佈情況進行分析和展現,如訪問頻率的使用者分佈情況,使用了條形圖進行展現,如圖6-9所示。

 

圖 6-3    Google Analytics使用者訪問頻率分佈圖

圖6-9展現了訪問次數在1~5次的使用者的訪問數和頁面瀏覽數,及訪問數和頁面瀏覽數在總體中所佔的比例。用於展現資料分佈情況的圖表有很多,比如用餅圖可以顯示每個資料類別的比例,可以用於新老使用者佔比的展現,最常用是直方圖,直方圖與柱狀圖比較類似,而柱狀圖常用來展現不同資料項的數量大小,如每個省份的訪問數,這裡的橫座標省份間是相互獨立的,所以每個柱形之間是相互分離的,而直方圖則常用於展現頻數和分佈,橫座標的資料一般是連續的,所以直方是緊靠在一起的,很多時候橫座標是基於分組的資料,我們將使用者的客單價分組後展現每組資料的使用者分佈比例,如圖6-10所示。

 

圖 6-4    客單價使用者分佈圖

圖6-10中,將客單價每隔30進行分組(圖中30顯示的是客單價為0~30的使用者比例,以此類推),大於300的獨立一組,統計每組使用者數及所佔比例並展示。資料的分組儘量使用一樣的組距,這樣可以讓資料看上去更均勻,但有時候由於資料分佈比較特殊,使用不相同的組距也未嘗不可,但要註釋清楚。直方圖的分組個數在6~20比較合適,如果橫座標的分組或資料項異常多,可能展現出來的直方圖看上去會非常密集,這時可以藉助“趨勢線”來觀察資料的整體分佈情況,或者使用帶平滑線的散點圖,如圖6-11所示。

 

圖 6-5    訪問間隔天數使用者分佈圖

圖6-11所示的是近60天中訪問的使用者的最近一次訪問距離當前的間隔天數的使用者分佈圖,顯示了每個訪問間隔天數的使用者比例,因為沒有對資料做分組,橫座標顯示了連續的60天的資料,所以使用了帶平滑曲線的散點圖進行展現,能夠比較直觀地展現使用者的保留情況。我們可以從圖中得到一些其他資訊,比如可以定義訪問間隔天數超過兩週的為沉默使用者或者休眠使用者,只要取訪問間隔天數超過14天的使用者就可以得到相應的使用者比例;如果定義訪問間隔超過30天的使用者為流失使用者,也可以從圖表中計算得到流失的使用者比例。所以基於使用者的行為分佈圖可以獲取一些額外的使用者統計指標。

直方圖或者帶平滑曲線的散點圖都只能表現使用者分佈的頻數或比例中的一個指標,藉助排列圖可以將頻數和比例同時展現在一張圖中,如圖6-12所示。

 

圖 6-6    消費次數使用者分佈排列圖

圖6-12的排列圖也叫帕累託圖,原先主要用於產品質量管理的領域,用於統計和分析引起產品質量問題的主要因素,使用直方圖表示資料分佈的頻數,使用折線圖表示資料分佈的頻率的累計。從這個消費次數的使用者分佈圖中可以得到很多資訊:零消費(消費次數為0次)使用者比例與消費(消費次數大於0次)使用者比例、單次消費(消費次數為1次)使用者比例和多次消費(消費次數大於1次)使用者比例,所以基於使用者分佈圖同樣可以做使用者的行為細分。

散點圖較多地用於表現兩個指標之間的聯絡,在相關分析和迴歸分析中較常用,但其本質也是展現資料的分佈,而且是基於兩個指標展現資料點的分佈位置,這裡選擇使用者訪問的平均停留時長和平均瀏覽頁面數來繪製散點圖,如圖6-13所示。

 

圖 6-7    平均訪問時長&頁面數使用者分佈圖

圖6-13中,我們抽取了100個使用者作為樣本展現每位使用者平均每次訪問的停留時長和瀏覽頁面數的分佈情況,從圖中可以發現網站中有多少使用者比較活躍,例如定義平均停留時長超過3分鐘(180秒)並且平均頁面瀏覽數超過3個的使用者為活躍使用者,那麼圖中綠框範圍內的使用者就是活躍使用者,並且越接近綠框的右上角,使用者的活躍度越高。

使用者行為指標的使用者分佈可以幫助我們發現許多額外的資訊,同時基於每期的統計結果進行比較並分析使用者各行為指標分佈的變化可以掌控使用者的發展情況,所以定期統計和分析使用者行為指標的分佈情況是十分有用的。

基於使用者細分的使用者行為分析

前面對使用者的分類和行為做了分析,但對於分析的輸出結果,我們可能無從下手,觀察新老使用者、流失使用者及使用者的各種行為指標和行為分佈也許可以做出很好的報告,評估使用者的發展情況,但結論太過巨集觀,我們所能做的也只是根據分析結果調整使用者的整體運營策略,其他能夠採取的細節措施寥寥無幾。而網站分析始終需要把握的一個前提就是分析的結果需要有效地指導行動(Take actions),所以這裡就要介紹如何得到更加有效的見解(Insights)。

前面已經介紹過一些常見的使用者分類:新老使用者、流失留存使用者等,不同的使用者分類群體可能會有不同的行為表現,我們可以通過分析各種使用者分類的使用者行為指標來區分各類使用者的特徵及對網站的期望要求,進而針對各類使用者群體進行調整和定向的營銷推廣。這裡主要以指導內容層面的調整為導向,通過比較各使用者細分群體對內容需求的差異,優化內容運營,將優質的內容或者符合使用者偏好的內容推薦給相應的使用者。這裡舉例三類使用者細分,即流失使用者與留存使用者、新使用者與老使用者、單次購買使用者和二次購買使用者,基於這三類細分,對每個分類的使用者購買商品進行比較分析,明確哪些商品更加符合使用者的預期。

這裡的細分比較還是以電子商務網站的資料為例,首先是基於流失使用者和留存使用者,電商網站的內容就是商品,我們基於每個商品計算購買這些商品的使用者中購買之後造成流失的使用者比例,如圖6-14所示。

 

圖 6-8    流失使用者和留存使用者細分比較

首先要明確一下圖中各指標的定義,每個商品的流失使用者比例應該是購買該商品後流失的使用者數在所有購買該商品的使用者中的佔比,但只知道每個商品的流失使用者比例無法評價這個商品是否對使用者保留有促進作用,或者在一定程度上造成了使用者的流失,只有通過與總體水平的比較才能得出相應的結論。所以這裡需要重點解釋的是“與總體比較”這個數值是怎麼計算得到的,這裡的百分比不是直接相減的結果,而是一個差異的幅度體現,這裡假設總體使用者流失率為56%,那麼以A商品為例,與總體比較的結果是:( 58.13% - 56% ) / 56% = 3.80%,使用同樣的計算方法也可以得到其他商品與總體比較的差異幅度。最後就是展示,在Excel中通過“條件格式”裡面的資料條功能可以直接展現出圖中的效果,非常方便。

圖6-14中擷取的Excel資料條的展示效果基於Excel2010,Excel2010開始支援雙向的資料條,以零為界,正數向右負數向左,2010之前的版本僅支援單向的資料條。資料條左右方向的顏色都可以自定義,預設負數為紅色、正數為綠色,基本思路是紅色表示指標表現較差,綠色表示指標表現較好,這裡因為與總體比較流失率較高(正數)表現為不好,比總體低(負數)表現較好,所以對資料條的左右顏色進行了互換,正數為紅色,表現較差,負數為綠色,表現較好,之後的圖表也遵從這個原則。

很明顯,圖6-14中的分析結果對運營調整有直接的指導性,目的是促進使用者保留,所以我們要做的就是將有利於使用者留存的商品(F商品的使用者流失率明顯要比總體低得多,說明F產品更有利於使用者保留)推薦給使用者,而將那些可能導致使用者流失的商品(C商品)進行優化或者下架。

同樣,使用上面的方法可以區分不同使用者群的購買偏向。新老使用者的細分是最常見的使用者細分方法,我們可以使用類似的方法來看看新老使用者對商品的不同喜好,如圖6-15所示。

 

圖 6-9    新老使用者細分比較

從圖6-15中你看出了什麼?購買D商品的使用者中新使用者的比例明顯偏低,也許新使用者根本就不喜歡這個商品,而B商品和F商品顯然更加符合新使用者的口味。如果你的網站可以進行新老使用者區分的定向推廣,那麼上面這個分析結果將讓你受益良多。

當然,這個資料呈現的特徵可能跟商品的推廣渠道有一定關係,比如圖6-15中的D商品可能使用老使用者比較集中的推廣渠道(如EDM),那麼購買使用者中自然老使用者的比例會偏高;或者把某些商品放在新使用者比較集中的Landing Page中展示,那麼購買該商品的新使用者比例顯然也會偏高。所以,在做此類分析時需要注意根據推廣渠道的差異,具體問題具體分析,不能一概而論。

再來看一下類似的方法怎麼促成使用者的重複購買。對於電子商務網站而言,使用者的首次購物體驗非常重要,這會直接影響使用者是否會產生再次或者之後的多次購買,或者是否能夠成為網站的忠誠客戶。如果你的網站注重使用者關係管理,有足夠的資料支援,那麼可以嘗試下使用如圖6-16所示的分析方法。

 

圖 6-10 首次二次購買使用者細分比較

需要注意的是,這裡的基礎使用者群設定在了每個商品的首次購買使用者(不是所有使用者),我們要分析的是所有將該商品作為首次購買商品的情況下,使用者是否還會發起之後的再次甚至多次購買行為(這裡的二次購買使用者不是指購買次數是2次的使用者,而是指所有購買次數超過1次的使用者),從而評價商品對於首次購買體驗的影響好壞。從圖6-16可以看出,B商品和F商品在促成二次購買的表現不佳,很有可能商品的使用或質量問題影響了使用者的滿意度,阻礙了使用者再次購買的腳步。根據分析結果,我們尤其需要對那些二次購買率比總體水平低很多的商品進行重點關注,同時也需要根據商品的特徵進行分析,有些商品確實比較容易促成二次購買,因為可能存在交叉銷售和向上營銷的情況。

如果你從Google Analytics上尋找類似的資料,其實唯一可以找到的就只有新訪問比例,因為GA沒法細分首次購買和二次購買使用者,而流失和留存使用者是網站的自定義指標。在GA的內容模組裡面細分到每個頁面的指標也未包含% New Visits(在流量來源、地域細分裡面有該度量),所以需要自定義報告來檢視網站每個頁面的新訪問比例,比較的基準還是網站總體的新訪問比例,GA的展現方式選擇裡面直接提供了與總體比較的檢視“Comparison”,圖6-17是我做的自定義報表。

 

圖 6-11 GA基於內容細分新老使用者比較

如圖6-17所示,GA上面展現的效果和用Excel 2010定製條件格式後的效果很像,這種基於基準的比較展現非常直觀實用,其實在其他分析中同樣可以用到。我的部落格文章的新使用者比例比較中可以分析出什麼?訪問數排在前幾名的文章中很明顯的趨勢就是概念性和方法論的文章的新使用者比例高於均值(當然主要靠搜尋引擎的幫忙),而觀點性和分析性的文章的新使用者比例低於均值(老使用者更偏向於實踐和應用),所以如果我的部落格可以動態向新使用者和老使用者展現不同的內容,那麼這個分析將十分有價值,也許你的網站可以嘗試一下。

最後用一句話總結:細分是用於比較的,比較是為了反映差異進而做出調整優化的,所以細分的目的最終還是指導運營決策,這才是資料分析的價值體現。

相關文章