資料分析專案精講!電商平臺人、貨、場分析實戰,附資料來源

綠色滑板鞋發表於2020-12-25

最近剛給帆軟的視覺化冬季挑戰賽當完評委,發現了一批非常好的資料分析專案案例,經過官方授權後,分享給大家。

今天為大家分享的專案作品是來自於參賽使用者楓城的作品,主題是基於人、貨、場的電商平臺資料分析,分析的思路非常清晰,視覺化報告的部分做的也不錯,對資料分析新手來說非常具有學習價值。

場景介紹

業務背景介紹:小風是一名剛入職的BI工程師,在試用期結束期間,導師拿著一份電商資料給到小風,要求其給出合理分析結果

分析目的:小風通過分析電商平臺兩年內的銷售情況和發展情況,找出平臺發展對應結論,並給出相應改善建議。

分析工具:FineBI,資料來源獲取方式見文末

分析思路

首先我們明確這次分析的目的對於電商平臺相關資料,分析發現問題並給出相關建議,決定從傳統的人,貨,場角度進行分析。

場的維度我們分析平臺銷售的健康情況和銷售分佈情況。可以得到平臺銷售的分佈特點和增長趨勢。

接著我們通過貨品分析,瞭解到該平臺,品類銷售情況和產品的價格帶在哪個位置,以此可以進行ABC分類的優化和了解平臺產品定位,同時我們通過評分還了解到產品體驗還有待優化,並嘗試定位產品低評的原因

接著會員分析,我們瞭解到會員的增長趨勢和會員的分佈情況,發現會員也大量分佈在巴西沿海,同時我們還通過AARRR模型和RFM模型瞭解到會員轉化率情況及消費屬性,並確定了重要價值客戶的佔比和地理分佈位置,客戶分層,有利於精準營銷。

同時通過分析會員訂單瞭解會員消費時間點和消費方式及平均付款時間。同時也通過會員的評分,瞭解到會員的潛在訴求。

其他分析-物流分析,最終分析了該平臺的物流情況,發現物流不準時佔比偏高,物流時間也偏長,但同時物流費用佔比訂單費用偏高,人們的消費和收到的服務不成正比,同時通過低評的不準時佔比和物流時間驗證該猜測,確定低評現象和物流服務有關。

最後,就以上結論和現象進行相關改善建議

整體分析腦圖如下所示:

資料整理

基礎資料表主要為以下9張,如下圖所示,AAARR模型表,巴西各州輔助表,表關係,地區經緯度表是我通過其他途徑獲得的輔助資料表。

主要用到自助資料集寬表為:訂單核心各維度聚合寬表,RFM模型表

資料整理過程:

第一步:獲取:登入kaggle,下載公共資料集,需要翻牆和擁有kaggle賬號。(想去Kaggle參加競賽的朋友可以找我要翻牆工具)

第二步:清洗:為了保證源資料準確性,將上述9張EXCEL基礎資料做去重及異常值處理(如資料查重,時間值前後,金額正負等常規判斷),通過EXCEL配合相應函式完成,因比較簡單,這邊不做過多敘述。

第三步:匯入傳入到FineBI,併為了方便操作,將每張EXCEL表單獨建立一張寬表,作為維度表。(方便單表新增欄位或維護),為後續製作大寬表打下資料基礎。

第四步:主要寬表製作(1)訂單核心各維度聚合寬表。

a、以Olist_order_dataset為核心表,連結各維度表,建立訂單核心各維度聚合寬表。其表間血緣關係如下所示。

b、選取訂單核心表,通過左右合併依次和各維度表進行合併

c增加過濾,過濾出2017年至2018年的資料

d、新增列是否準時 通過預期物流到貨時間和實際到貨時間比較

e、新增列新老會員

f、訂單核心各維度聚合寬表建立完畢,其雪花模型如下所示。

第四步(2):主要寬表製作(2) RFM模型表

a、首先取訂單核心各維度聚合寬表對應欄位。

b、新增列,距今消費時間天數,後續可計算平均消費時間天數,並以此判斷R值

同理,通過會員消費頻次,計算平均會員頻次,比以此進行F值計算;通過會員消費金額,計算平均會員消費金額,並以此進行M值計算。

c、合併RFM,對R,F,M進行拼接

d、通過IF函式對RFM進行中文定義

至此相關資料處理完畢,資料整理告一段落。

完成分析報告

a、整體框架:整體排版按照故事的敘事來進行排版,具體為如下板塊,任務背景,明確目的->“場”分析->“貨”分析->”人”分析->其他分析->總結建議。

b、圖表選擇:圖表選擇可以看這張圖:

c、分析思路和對應結論

場分析:通過季銷售趨勢圖及環比,還有各州金額分佈分析瞭解平臺銷售走勢和銷售分佈,瞭解平臺銷售是否健康及銷售重點區域。

1)發現相較2017年,2018年的銷售金額和銷售量呈環比上升趨勢,最近兩季度略微下降,趨向平穩。平臺客單價在175Reals/單浮動。說明平臺整體的態勢還是向上發展的。

2)瞭解到訂單來源主要來自巴西沿海各州,其中聖保羅州,里約熱內盧州,米納斯吉拉斯州為訂單量產出州TOP3,而反觀巴西內地產出偏低,小風猜測這也許巴西經濟中心集中在沿海各州有關。

貨分析:通過帕累託分析品類銷售情況,散點圖探究品類寬度和銷售關係,再通過價格帶分析,瞭解平臺產品定位。通過評價佔比瞭解產品滿意情況,通過產品完整性分析驗證猜測。

1)發現health_beauty,watches_gifts,bed_bath_table這三個品類為該平臺熱賣品類,且18年銷售均大於17年,呈上升趨勢

2)通過散點圖分析,確認了寬度越寬的品類往往銷售額也越高

3)列出TOP10銷售的產品,得到平臺價格帶定位在0-100 ,主要面向低端客戶群體

4)1-2分的低評佔了評價的18%,平臺服務有很大提升空間,探索其低分原因不是由產品本身不完整性導致的

人分析:分析平臺會員走勢瞭解平臺會員健康情況,通過地圖分佈瞭解會員分佈情況,通過AARRR模型瞭解會員轉化率,通過環形圖瞭解新老會員銷售情況。利用RFM模型給會員分層並確定重要價值客戶分佈。利用會員行為分析瞭解會員下單時間,付費方式和平均付款時間,還知道會員低分佔比及評論時間趨向。

1)發現2017年至2018年會員總體呈上升趨勢,但2018年第三季度呈現下滑狀態。

2)通過會員各州分佈和城市分佈發現,會員主要集中在聖保羅州,里約熱內盧州,主要分佈城市為sao paulo riode janeiro

3)一般電商模型為AARRR模型,發現平臺轉化率在98%左右。

4)發現重要價值客戶佔會員體系的17%,而重要價值客戶也憑藉著自己的高客單,高銷量為銷售額提供了主要貢獻。

5)會員下單主要集中在11點,16點,20點,喜歡用credit_card作為支付手段,平均付款時間在6.46小時。

6)發現會員評分4-5分約佔78%,總體好評居多,但1-2分也佔據著13%,存在一定風險,可以適當優化,會員評論時間集中在11-12,21-23時間段。

其他分析:通過物流準時度分析,物流時間佔訂單時間分析,平均物流天數分析,物流運費金額在總金額的佔比,來評估顧客物流服務投入產出比,通過低評的非準時佔比和物流時間來驗證猜測。

1)顧客對物流服務的投入產出比低下,造成較大不滿

2)低評確實是由物流因素引起

對應建議:

d、顏色總體偏深色調佈局,淺色系佈局一直不好拿捏,後期再進行嘗試,統一調整了字型和字號,讓畫面看起來更整齊美觀,並在結論處對應指標做顏色標識,如代表好的指標為紅色系,代表差的指標為綠色系,整個優化採取區域性美化,完成時整體調優的方式

調色網站推薦:Material Palette:http://www.materialpalette.com/,Flat UI Colors:http://flatuicolors.com/

e、作品展示(有些模糊,原圖太大,放不進來,只能壓縮,將就著看了,有興趣的可以下載PDF看)

總結

經驗分享:帶著目的去分析,按照分析框架,循序漸進,去享受分析的過程。

作品pdf版本及資料來源下載,轉發收藏本文,後臺私信“電商分析”領取!

相關文章