資料建模實戰,Smartbi帶你玩轉購物籃分析

思邁特Smartbi 發表於 2022-01-14

購物籃分析是一個非常重要的模型,關於啤酒與尿布的故事,這個故事很好地解釋了商品關聯性的作用,時至今日,仍有很強的現實指導意義。這種資料,將不同商品關聯起來,並挖掘二者之間聯絡的分析方法,就叫作“購物籃分析”。購物籃分析的實現方法有很多,下面教一下大家如何去製作一個完整的購物籃分析模型。


一、前言:


在開始製作前,先來理解一下它的價值在哪。購物籃分析的本質是研究商品與商品間的關聯關係,比如分析A商品和哪個商品搭配會賣的更好,或者分析客戶在購買了A商品之後,對B商品會產生什麼影響等等。通過這種交叉分析,我們便可以對客戶感興趣的商品組合去做出相應的調整,或者據此去深入研究更高層次的推薦演算法。

資料建模實戰:玩轉購物籃分析452.png 


先來理解以下三個概念,支援度指同時被購買的概率,用公式則表示支援度=同時購買A和B訂單數/總購買訂單數;置信度是指購買A之後又購買B的條件概率,用公式表示就是置信度;提升度指的是先購買A對購買B的提升作用,用公式表示就是提升度((購買A次數)*(購買B次數))。可看下圖說明,加深理解:


資料建模實戰:玩轉購物籃分析598.png 


二、購物籃分析步驟:


需先準備關於零售行業的資料來源,包含單據編碼、商品名稱等資訊,可以在文末進行獲取。如果用Excel做購物籃分析,難度會很大,建議用其他工具進行製作,本文選擇用SQL語句的方式去製作:


資料建模實戰:玩轉購物籃分析702.png 


第一步,新建臨時表,進行交叉關聯,為每一組交叉商品增加一列總訂單數的欄位,表命名為t1:


資料建模實戰:玩轉購物籃分析749.png

 

執行語句後,可得出以下4個欄位:


資料建模實戰:玩轉購物籃分析768.png 


第二步,新建臨時表t2,再次進行交叉關聯,算出同時購買A商品與B商品的訂單數:


資料建模實戰:玩轉購物籃分析810.png

 

執行後,可得出:


資料建模實戰:玩轉購物籃分析821.png

 

第三步,把t1與t2兩個臨時表的欄位進行關聯:


資料建模實戰:玩轉購物籃分析847.png

 

執行語句後,可得出以下4個欄位:


資料建模實戰:玩轉購物籃分析947.png

 

第四步,新建t4,算出A訂單數: 


資料建模實戰:玩轉購物籃分析1163.png

 

執行語句後,可得出以下2個欄位:


資料建模實戰:玩轉購物籃分析1176.png

 

第五步,新建臨時表t5,算出B訂單數: 


  資料建模實戰:玩轉購物籃分析928.png


執行語句後,可得出以下2個欄位:


資料建模實戰:玩轉購物籃分析947.png

 

最後一步,根據支援度、置信度與提升度的公式,以及我們得出的資料,便可運算了。根據t3表裡‘’同時購買A和B訂單數‘’與‘’總訂單數‘’這兩個欄位,我們可以算出支援度的資料。根據t3表裡‘’同時購買A和B訂單數‘’與t4表裡‘’A商品訂單數‘’這兩個欄位,我們可以算出置信度的資料。同理,利用‘’同時購買A和B訂單數‘’、‘’購買A訂單數‘’、‘’購買B訂單數‘’與‘’總訂單數‘’這幾個欄位,我們最後就可以得出提升度的資料了。


資料建模實戰:玩轉購物籃分析1163.png

 

最後得出的結果如下:


資料建模實戰:玩轉購物籃分析1176.png

 

三、後續建議:


從上面的過程來看,我們可得出製作購物籃的過程很複雜。為了對資料建模以及多維分析有更深的認識,小編推薦大家利用智分析的資料模型去製作購物籃分析,智分析的資料模型具有非常強大的多維分析能力,不僅支援自助取數,還支援SQL、MDX等高階的查詢語法。智分析的資料來源介面同樣也很豐富,可以連線各種資料庫,也可以以Excel檔案匯入的方式進行匯入:


資料建模實戰:玩轉購物籃分析1355.png 


進入資料模型的介面後,便可以開始搭建購物籃分析的資料模型了,這裡依然是選擇舊方法,新建一個SQL查詢,按照步驟便可得出資料:


資料建模實戰:玩轉購物籃分析1420.png 


資料模型搭建後,便可對購物籃分析的資料更為清晰地呈現出來,儀表盤便可進行高階操作,非常適合展示購物籃分析、RFM分析、ABC分析等資料模型:


資料建模實戰:玩轉購物籃分析1493.png 


PS:上方提及的資料,關注公眾號【思邁特Smartbi】後私信便可獲取。





來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69965912/viewspace-2852338/,如需轉載,請註明出處,否則將追究法律責任。