資料建模實戰,Smartbi帶你玩轉購物籃分析
購物籃分析是一個非常重要的模型,關於啤酒與尿布的故事,這個故事很好地解釋了商品關聯性的作用,時至今日,仍有很強的現實指導意義。這種資料,將不同商品關聯起來,並挖掘二者之間聯絡的分析方法,就叫作“購物籃分析”。購物籃分析的實現方法有很多,下面教一下大家如何去製作一個完整的購物籃分析模型。
一、前言:
在開始製作前,先來理解一下它的價值在哪。購物籃分析的本質是研究商品與商品間的關聯關係,比如分析A商品和哪個商品搭配會賣的更好,或者分析客戶在購買了A商品之後,對B商品會產生什麼影響等等。通過這種交叉分析,我們便可以對客戶感興趣的商品組合去做出相應的調整,或者據此去深入研究更高層次的推薦演算法。
先來理解以下三個概念,支援度指同時被購買的概率,用公式則表示支援度=同時購買A和B訂單數/總購買訂單數;置信度是指購買A之後又購買B的條件概率,用公式表示就是置信度;提升度指的是先購買A對購買B的提升作用,用公式表示就是提升度((購買A次數)*(購買B次數))。可看下圖說明,加深理解:
二、購物籃分析步驟:
需先準備關於零售行業的資料來源,包含單據編碼、商品名稱等資訊,可以在文末進行獲取。如果用Excel做購物籃分析,難度會很大,建議用其他工具進行製作,本文選擇用SQL語句的方式去製作:
第一步,新建臨時表,進行交叉關聯,為每一組交叉商品增加一列總訂單數的欄位,表命名為t1:
執行語句後,可得出以下4個欄位:
第二步,新建臨時表t2,再次進行交叉關聯,算出同時購買A商品與B商品的訂單數:
執行後,可得出:
第三步,把t1與t2兩個臨時表的欄位進行關聯:
執行語句後,可得出以下4個欄位:
第四步,新建t4,算出A訂單數:
執行語句後,可得出以下2個欄位:
第五步,新建臨時表t5,算出B訂單數:
執行語句後,可得出以下2個欄位:
最後一步,根據支援度、置信度與提升度的公式,以及我們得出的資料,便可運算了。根據t3表裡‘’同時購買A和B訂單數‘’與‘’總訂單數‘’這兩個欄位,我們可以算出支援度的資料。根據t3表裡‘’同時購買A和B訂單數‘’與t4表裡‘’A商品訂單數‘’這兩個欄位,我們可以算出置信度的資料。同理,利用‘’同時購買A和B訂單數‘’、‘’購買A訂單數‘’、‘’購買B訂單數‘’與‘’總訂單數‘’這幾個欄位,我們最後就可以得出提升度的資料了。
最後得出的結果如下:
三、後續建議:
從上面的過程來看,我們可得出製作購物籃的過程很複雜。為了對資料建模以及多維分析有更深的認識,小編推薦大家利用智分析的資料模型去製作購物籃分析,智分析的資料模型具有非常強大的多維分析能力,不僅支援自助取數,還支援SQL、MDX等高階的查詢語法。智分析的資料來源介面同樣也很豐富,可以連線各種資料庫,也可以以Excel檔案匯入的方式進行匯入:
進入資料模型的介面後,便可以開始搭建購物籃分析的資料模型了,這裡依然是選擇舊方法,新建一個SQL查詢,按照步驟便可得出資料:
資料模型搭建後,便可對購物籃分析的資料更為清晰地呈現出來,儀表盤便可進行高階操作,非常適合展示購物籃分析、RFM分析、ABC分析等資料模型:
PS:上方提及的資料,關注公眾號【思邁特Smartbi】後私信便可獲取。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69965912/viewspace-2852338/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 資料建模實戰:方寸之間玩轉購物籃分析
- 資料分析一定要懂的模型——購物籃模型模型
- Smartbi帶你一文玩轉波士頓矩陣矩陣
- 三個點帶你解讀Smartbi商業智慧大資料分析平臺大資料
- 帶你重新“玩轉”FlutterFlutter
- Python 資料分析實戰 | 用資料帶你回顧喬丹的職業生涯Python
- 不知道怎麼做電商資料分析?Smartbi一文帶你入門
- 一篇長文帶你在python裡玩轉Json資料PythonJSON
- 功能強大!帶你走近Smartbi增強分析模組
- Excel不夠用?Smartbi的Excel融合分析帶你飛Excel
- 手摸手帶你玩轉Xcode ExtensionsXCode
- CryptAssist-帶你玩轉幣圈
- 手把手帶你玩轉LinuxLinux
- 超強劇透 | 帶你玩轉Smartbi新品線上交流會,10月21日不見不散
- 還不瞭解資料庫?Smartbi一文帶你入門資料庫!資料庫
- Python玩轉物聯網--《物聯網Python開發實戰》新書釋出Python新書
- 某大型商超客戶採購資料分析(Spark實戰)Spark
- 開源 5 款超好用的資料庫 GUI 帶你玩轉 MongoDB、Redis、SQL 資料庫資料庫GUIMongoDBRedisSQL
- 工業資料分析之數倉建模 | 正規化建模和維度建模,你pick誰?
- Python | 資料分析實戰ⅠPython
- Python | 資料分析實戰 ⅡPython
- 純乾貨:21天帶你玩轉容器
- 老司機帶你玩轉Radare2
- 架構師帶你玩轉分散式鎖架構分散式
- EasyNLP帶你玩轉CLIP圖文檢索
- 帶你玩轉RabbitMQ的五種佇列MQ佇列
- 玩轉大資料系列之二:資料分析與處理大資料
- 淘寶雙十一之外,實在RPA帶你玩轉私域流量!
- 資料分析與挖掘-挖掘建模
- 說說資料分析中的資料建模
- 三步帶你玩轉前端裝飾器前端
- 用《Excel》玩轉格式,輕鬆分析龐大資料!Excel大資料
- 帶你玩轉小程式開發實踐|含直播回顧視訊
- 帶你玩轉Flink流批一體分散式實時處理引擎分散式
- 大資料建模、分析、挖掘技術大資料
- Python 資料分析實戰——可轉債打新能賺錢嗎?Python
- 帶你7天玩轉視覺化建站平臺視覺化
- 七天帶你玩轉MySQL之SQL語句MySql