資料建模實戰:方寸之間玩轉購物籃分析

hxc979891發表於2021-08-25

購物籃分析是零售行業裡非常重要經典的一個模型,曾經被大家津津樂道的啤酒與尿布的故事,相信大家都還記憶猶新,這個故事很好地詮釋了商品關聯性對銷售額的提升作用,時至今日,仍有很強的現實指導意義。這種透過研究使用者消費資料,將不同商品之間進行關聯,並挖掘二者之間聯絡的分析方法,就叫做商品關聯分析法,也叫作“購物籃分析”。購物籃分析的實現方法有很多,下面教一下大家如何去製作一個完整的購物籃分析模型。

一、前言:

在開始製作購物籃分析模型之前,我們先來理解一下購物籃分析模型的價值在哪裡。購物籃分析的本質是研究商品與商品間的關聯關係,比如分析A商品和哪個商品搭配會賣的更好,或者分析客戶在購買了A商品之後,對B商品會產生什麼影響等等。透過這種交叉分析,我們便可以對客戶感興趣的商品組合去做出相應的調整,或者據此去深入研究更高層次的推薦演算法。

做購物籃分析還得先理解三個概念,支援度、置信度與提升度。支援度指A商品和B商品同時被購買的機率,用公式表示就是支援度=同時購買A和B訂單數/總購買訂單數;置信度是指購買A之後又購買B的條件機率,用公式表示就是置信度=同時購買A和B訂單數/購買A的訂單數;提升度指的是先購買A對購買B的提升作用,用公式表示就是提升度=支援度/((購買A次數/總購買訂單數)*(購買B次數/總購買訂單數))。看不懂的小夥伴可以看下圖的舉例說明,加深理解:

二、購物籃分析步驟:

首先要準備一份零售行業的資料來源,需包含單據編碼、商品名稱等資訊,文中提供的案例資料來源大家可以在根據文末提供的資訊進行獲取。如果用Excel做購物籃分析,難度會很大,建議用其他工具進行製作,本文選擇用SQL語句的方式去製作:

第一步,新建一個臨時表,對商品名稱進行交叉關聯,為每一組交叉商品增加一列總訂單數的欄位,並把該臨時表命名為t1:

執行語句後,可得出以下4個欄位:

第二步,新建一個臨時表t2,對商品名稱進行交叉關聯,算出同時購買A商品與B商品的訂單數:

執行語句後,可得出以下3個欄位:

第三步,把t1與t2兩個臨時表的欄位進行關聯:

執行語句後,可得出以下4個欄位:

第四步,新建一個臨時表t4,算出A商品的訂單數:

執行語句後,可得出以下2個欄位:

第五步,新建一個臨時表t5,算出B商品的訂單數:

執行語句後,可得出以下2個欄位:

最後一步,根據支援度、置信度與提升度的公式,以及我們得出的這5個臨時表的資料,我們就可以開始進行運算了。根據t3表裡‘’同時購買A和B訂單數‘’與‘’總訂單數‘’這兩個欄位,我們可以算出支援度的資料。根據t3表裡‘’同時購買A和B訂單數‘’與t4表裡‘’A商品訂單數‘’這兩個欄位,我們可以算出置信度的資料。同理,利用‘’同時購買A和B訂單數‘’、‘’購買A訂單數‘’、‘’購買B訂單數‘’與‘’總訂單數‘’這幾個欄位,我們最後就可以得出提升度的資料了。

最後得出的結果如下:

三、後續建議:

從上面的製作過程來看,如果要製作一個完整的購物籃分析模型,過程還是挺複雜的。為了對資料建模以及多維分析有更深的認識,小編推薦大家利用智分析的資料模型去製作購物籃分析,智分析的資料模型具有非常強大的多維分析能力,不僅支援自助取數,還支援SQL、MDX等高階的查詢語法。智分析的資料來源介面同樣也很豐富,可以連線各種資料庫,也可以以Excel檔案匯入的方式進行匯入:

進入資料模型的介面後,便可以開始搭建購物籃分析的資料模型了,這裡依然是選擇用SQL查詢的方法去做購物籃分析,新建一個SQL查詢,輸入語句,執行後便可以得出購物籃分析模型的資料:

資料模型搭建之後,可以藉助智分析自助儀表盤對購物籃分析的資料進行視覺化呈現,儀表盤可以進行下鑽、篩選、輪播等高階的操作,非常適合展示購物籃分析、RFM分析、ABC分析等資料模型:

PS :關於文中提到的資料來源以及模型資料,大家可以點關注之後私信我進行獲取


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69980489/viewspace-2788699/,如需轉載,請註明出處,否則將追究法律責任。

相關文章