資料建模實戰:方寸之間玩轉購物籃分析
購物籃分析是零售行業裡非常重要經典的一個模型,曾經被大家津津樂道的啤酒與尿布的故事,相信大家都還記憶猶新,這個故事很好地詮釋了商品關聯性對銷售額的提升作用,時至今日,仍有很強的現實指導意義。這種透過研究使用者消費資料,將不同商品之間進行關聯,並挖掘二者之間聯絡的分析方法,就叫做商品關聯分析法,也叫作“購物籃分析”。購物籃分析的實現方法有很多,下面教一下大家如何去製作一個完整的購物籃分析模型。
一、前言:
在開始製作購物籃分析模型之前,我們先來理解一下購物籃分析模型的價值在哪裡。購物籃分析的本質是研究商品與商品間的關聯關係,比如分析A商品和哪個商品搭配會賣的更好,或者分析客戶在購買了A商品之後,對B商品會產生什麼影響等等。透過這種交叉分析,我們便可以對客戶感興趣的商品組合去做出相應的調整,或者據此去深入研究更高層次的推薦演算法。
做購物籃分析還得先理解三個概念,支援度、置信度與提升度。支援度指A商品和B商品同時被購買的機率,用公式表示就是支援度=同時購買A和B訂單數/總購買訂單數;置信度是指購買A之後又購買B的條件機率,用公式表示就是置信度=同時購買A和B訂單數/購買A的訂單數;提升度指的是先購買A對購買B的提升作用,用公式表示就是提升度=支援度/((購買A次數/總購買訂單數)*(購買B次數/總購買訂單數))。看不懂的小夥伴可以看下圖的舉例說明,加深理解:
二、購物籃分析步驟:
首先要準備一份零售行業的資料來源,需包含單據編碼、商品名稱等資訊,文中提供的案例資料來源大家可以在根據文末提供的資訊進行獲取。如果用Excel做購物籃分析,難度會很大,建議用其他工具進行製作,本文選擇用SQL語句的方式去製作:
第一步,新建一個臨時表,對商品名稱進行交叉關聯,為每一組交叉商品增加一列總訂單數的欄位,並把該臨時表命名為t1:
執行語句後,可得出以下4個欄位:
第二步,新建一個臨時表t2,對商品名稱進行交叉關聯,算出同時購買A商品與B商品的訂單數:
執行語句後,可得出以下3個欄位:
第三步,把t1與t2兩個臨時表的欄位進行關聯:
執行語句後,可得出以下4個欄位:
第四步,新建一個臨時表t4,算出A商品的訂單數:
執行語句後,可得出以下2個欄位:
第五步,新建一個臨時表t5,算出B商品的訂單數:
執行語句後,可得出以下2個欄位:
最後一步,根據支援度、置信度與提升度的公式,以及我們得出的這5個臨時表的資料,我們就可以開始進行運算了。根據t3表裡‘’同時購買A和B訂單數‘’與‘’總訂單數‘’這兩個欄位,我們可以算出支援度的資料。根據t3表裡‘’同時購買A和B訂單數‘’與t4表裡‘’A商品訂單數‘’這兩個欄位,我們可以算出置信度的資料。同理,利用‘’同時購買A和B訂單數‘’、‘’購買A訂單數‘’、‘’購買B訂單數‘’與‘’總訂單數‘’這幾個欄位,我們最後就可以得出提升度的資料了。
最後得出的結果如下:
三、後續建議:
從上面的製作過程來看,如果要製作一個完整的購物籃分析模型,過程還是挺複雜的。為了對資料建模以及多維分析有更深的認識,小編推薦大家利用智分析的資料模型去製作購物籃分析,智分析的資料模型具有非常強大的多維分析能力,不僅支援自助取數,還支援SQL、MDX等高階的查詢語法。智分析的資料來源介面同樣也很豐富,可以連線各種資料庫,也可以以Excel檔案匯入的方式進行匯入:
進入資料模型的介面後,便可以開始搭建購物籃分析的資料模型了,這裡依然是選擇用SQL查詢的方法去做購物籃分析,新建一個SQL查詢,輸入語句,執行後便可以得出購物籃分析模型的資料:
資料模型搭建之後,可以藉助智分析自助儀表盤對購物籃分析的資料進行視覺化呈現,儀表盤可以進行下鑽、篩選、輪播等高階的操作,非常適合展示購物籃分析、RFM分析、ABC分析等資料模型:
PS :關於文中提到的資料來源以及模型資料,大家可以點關注之後私信我進行獲取
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69980489/viewspace-2788699/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 資料建模實戰,Smartbi帶你玩轉購物籃分析
- 資料分析一定要懂的模型——購物籃模型模型
- 市場購物籃分析(規則歸納/C5.0)+apriori
- 玩轉 React(七)- 元件之間的資料共享React元件
- 自學Vue的第06天:實戰之購物車Vue
- C++實戰之資料抽象 (轉)C++抽象
- 學懂分析,玩轉大資料大資料
- 某大型商超客戶採購資料分析(Spark實戰)Spark
- 玩轉 JavaScript 之資料型別JavaScript資料型別
- 資料分析 | Numpy實戰(一) - 分析某單車騎行時間
- 資料分析實戰45講-陳暘-極客時間
- 【機器學習PAI實戰】—— 玩轉人工智慧之綜述機器學習AI人工智慧
- 玩轉資料結構之陣列資料結構陣列
- 工業資料分析之數倉建模 | 正規化建模和維度建模,你pick誰?
- Python玩轉物聯網--《物聯網Python開發實戰》新書釋出Python新書
- Go-kratos 框架商城微服務實戰之購物車服務 (十二)Go框架微服務
- Python | 資料分析實戰ⅠPython
- Python | 資料分析實戰 ⅡPython
- 資料分析與挖掘-挖掘建模
- 業務資料分析和建模薦
- 資料治理之資料梳理與建模
- 【機器學習PAI實戰】—— 玩轉人工智慧之美食推薦機器學習AI人工智慧
- 說說資料分析中的資料建模
- 玩轉大資料系列之二:資料分析與處理大資料
- 從AdventureWorks學習資料庫建模——實體分析資料庫
- 分析:線上購物與支付
- 空間統計之點資料分析
- 大資料建模、分析、挖掘技術大資料
- 用《Excel》玩轉格式,輕鬆分析龐大資料!Excel大資料
- NSData之間資料型別轉化資料型別
- 基於XML的購物車的實現(轉)XML
- 資料治理一體化實踐之體系化建模
- ERP物資採購策略模型的研究(轉)模型
- 玩轉資料庫索引資料庫索引
- 七牛大資料平臺的實時資料分析實戰大資料
- 玩轉大資料系列之四:搜尋服務大資料
- js逆向實戰之中國男子籃球職業聯賽官方網站返回資料解密JS網站解密
- BI、資料倉儲和資料分析之間的區別