百分點資料科學實驗室:零售行業新店品類配比測算方案
編者按:零售行業是資料科學的重要應用領域之一。零售領域有著豐富的資料和大量的優化問題,如商品定價、折扣、庫存水平、客戶分類、訂單挑選與配送,以及品類配比等。
本篇文章結合百分點資料科學實驗室的實踐經驗,分享了
新開門店品類配比優化問題。例如,某綜合性商場計劃開業,如何配比各品類商品,才能夠讓各品類的銷售額、毛利額、毛利率以及所佔面積在約束範圍內,實現新開門店最佳綜合效益。
在零售商品定價問題中,銷售商考慮到商品進貨時間、批量及儲存費用等約束,建立優化模型制定價格策略:目標為極大化總收益,約束條件是分別對庫存與價格規定上下限,從而求得商品在某季節的最優定價[1]。零售客戶分類問題本質上是利用優化演算法對客戶進行聚類,根據結果對各個類別客戶的特點進行分析,提出針對性的營銷及決策方案[2]。在零售訂單挑選與配送問題中,考慮訂單的總延遲時間、違約率與履約總成本這三個目標,約束條件考慮每個訂單的履約時間窗,訂單揀選順序,訂單配送車輛路徑等因素,建立訂單揀選排序與配送的聯合優化模型,通過優化演算法進行求解,從而解決訂單履約時間較長的問題[3]。
針對某集團品類規劃部門對於新開門店的品類配比測算需求,專案組針對零售實體商店的商品品類配比決策模型進行研究。在查閱總結了多篇相關論文資料後,專案組將新開門店品類配比的目標鎖定為門店效益最佳,即銷售毛利綜合最優,約束條件考慮各品類的銷售額、毛利額、毛利率以及所佔面積,建立線性規劃模型,求解不同品類的銷售毛利配比,為品類規劃部門提供合理的新店品類配比方案,幫助客戶運用資料建立最優化模型進行科學決策,從而提高新開門店預期收益。
一、
解決方案-模型篇
1.
最優化演算法
在現有零售行業品類配比研究中,使用較多的是最優化演算法[4][5]。下方給出優化演算法的基本結構。
這裡,x={x1,…,xn}稱為問題的決策變數,函式f0稱為
目標函式,不等式fi(x)≤0與等式hi(x)=0稱為
約束條件。在所有滿足約束的向量中,向量x*對應的目標函式值最小,那麼稱x*為該問題的最優解。
所謂優化演算法,其實就是構造一種搜尋規則,基於某種思想和機制,通過搜尋規則尋找到滿足使用者要求的問題的解。具體來說,優化演算法是在從眾多可能的選擇中做出最優選擇,使得系統的目標函式在約束條件下達到最大或最小。
按約束條件分類,優化演算法可以分為無約束的優化問題、有等式約束的優化問題與有不等式約束的優化問題。
最優化問題又可以根據目標函式的狀態分類,如下圖所示。
2.
凸優化演算法
在連續最優化問題中,凸優化是非常特殊的。凸優化在數學規劃領域具有非常重要的地位。從應用角度看,一旦將一個實際問題表述為凸優化問題,大體上更意味著相應問題已經得到徹底解決,這是非凸的優化問題所不具有的性質。從理論角度看,用凸優化模型對一般性非線性優化模型進行區域性逼近,始終是研究非線性規劃問題的主要途徑。
求解無約束的凸優化問題,通常使用的方法是Fermat定理,即求解目標函式f0的梯度,令其為零,解得最優值為全域性最優點。
求解僅含等式約束的凸優化問題,通常使用的方法是拉格朗日乘子法,即構造拉格朗日函式,對各個變數進行求導,令其為零,解得最優值為全域性最優點。
求解含不等式約束的凸優化問題,通常使用的方法是KKT條件,通過KKT條件,求解最優值。
3. 線性規劃
在凸優化問題中,線性規劃又是極為代表性的一類問題。雖然按約束條件分類,線性規劃問題屬於最複雜的含不等式約束的凸優化問題,但是由於其結構的特殊性,即目標函式與約束條件都是線性的,線性規劃問題有成熟的求解演算法包對問題進行求解。可以利用python或R等程式語言呼叫線性規劃演算法包,快速得到線性規劃問題的最優解。
其中,向量c,a1,…,am ∈ Rn,b,…,bm ∈ R是問題引數。
4. 模型的選擇
非凸優化問題是非常難求解的,因為可行域集合可能存在無數個區域性最優點,求解全域性最優的演算法複雜度是指數級的;而凸優化問題具有任何區域性最優解即為全域性最優解這一優良性質,因此,利用如貪婪演算法或下降方法可以非常高效地對問題進行求解。考慮到模型演算法的效率與可解釋性,在本次品類配比測算中,專案組將使用凸優化演算法中的線性規劃模型搭建新店品類配比測算模型。
二、
解決方案-業務篇
專案組選擇了線性規劃演算法作為新店品類規劃的基礎演算法,並根據業務需求,制定了兩套模型解決方案,建模框架如下圖。
線性規劃模型由兩個部分組成,其一是目標函式,其二是約束條件,目標函式與約束條件都是由決策變數構造的線性函式。模型構建的重中之重,是根據業務需求,構建線性規劃模型的目標函式與約束條件。
1. 目標函式
本次專案的目標是找到讓新店效益最佳的品類配比方案。因此,目標函式的構建需要緊扣“門店效益”。專案組將門店效益刻畫為各個品類的銷售額之和與毛利額之和的總和,用xi1來表示第i個品類的銷售額,用xi2來表示第i個品類的毛利額,那麼目標函式就可以寫為:
2. 約束條件
約束方法根據業務部門的需求,建立了兩種不同的模型測算方案。模型1依據業務部門的預測業績資料對各品類的銷售額、毛利額、毛利率及坪效進行約束限制;模型2依據與新店類似的兩個老店的歷史業績資料對新店各品類銷售額、毛利額、毛利率及坪效進行約束限制。
首先聚焦模型1的約束條件。業務部門提供了對新開門店未來三年各品類的銷售與毛利業績預測。對於各品類銷售額與毛利額的約束,將預測最小值作為約束下限,將預測最大值作為約束上限,從而完成對銷售額與毛利額的約束條件構造。
對於各品類毛利率的約束,將預測最大值作為約束上限,將預測平均值作為約束下限,從而完成對各品類毛利率約束條件的構造。
坪效是計算商場經營效益的重要指標。模型除了對各品類的銷售額毛利額以及毛利率進行約束以外,還補充了利用各品類坪效對各品類面積的約束,使得模型結果符合門店經營規模,合理有效。
模型2的約束條件與模型1類似,區別在於,當利用與新店類似的兩個老店歷史業績資料對新店各品類進行約束時,需要將數值轉化為佔比,規則如下:
三、
建設成果
根據解決方案-業務篇搭建的模型架構,利用R語言Rglpk包的Rglpk_solve_LP函式進行求解,得到結果如下:
對比兩個模型的銷售額佔比結果,可以看到,模型1直接利用業務部門預測資料計算坪效,可能會導致結構失衡,體現在品類6的銷售額佔比偏高;而模型2完全基於歷史資料,與模型1相比,品類1銷售額佔比偏低,品類7銷售額佔比偏高。
同時,我們也可以得到兩個模型的毛利額佔比結果,從結果圖中看到,模型1在品類6上也出現了同樣的問題,直接利用業務部門預測資料計算坪效,可能會導致結構失衡,體現在品類6的毛利額佔比也偏高;而模型2完全基於歷史資料,與模型1相比,品類7毛利額佔比偏低;對於品類9而言,因為B店無品類9,A店品類9的品牌數量也非常少,品類9完全依賴歷史資料結果偏高。
對比模型1與模型2,兩者本質區別在於,模型1完全利用業務部門的預測業績資料作為約束條件,而模型2則是完全基於與新店類似的老門店的歷史業績資料構造約束條件。為確定選取哪個模型作為最終結果,專案組與品類規劃部門進行了充分的溝通確認,品類規劃部門表示希望可以儘可能少地利用人為預測資料,因此,品類規劃部門與專案組共同確認以模型2作為實際應用模型。
聚焦模型2的結果,門店的銷售額指標中,品類7的佔比遠超其他品類,第二梯隊是品類1、品類8與品類9,第三梯隊是品類5、品類6與品類3,品類4與品類2佔比最低。門店的毛利額指標中,依然是品類7的佔比遠超其他品類,第二梯隊的是品類1、品類8與品類9,第三梯隊是品類5與品類3,品類4、品類6與品類2佔比最低。詳見下圖。
待門店開業後,可利用模型基於第一個月/第一年的資料進行迭代,產出下月/年的品類配比最優解,調整各品類所佔經營面積,依次迭代,持續優化品類配比結構,不斷提高門店的下一期預期收益。
結語
本次結合優化演算法與業務需求所形成的品類配比測算方案,主要應用於新店品類配比規劃,其簡化模型也可應用於已開門店的品類配比優化。模型核心在於,在合理範圍內調整各品類的配比結構,提高門店未來一期的預期收益。
品類配比規劃是優化模型在零售行業中的一個分支應用,也是資料探勘技術在零售行業中的一個應用案例。優化演算法等資料探勘技術賦能零售業,提高資料利用率,將零售行業中大量資料轉化為有效決策,實現智慧零售轉型,提高零售企業自身競爭力,在激烈的市場競爭中立於不敗之地。
參考資料
[1]王巨集達.電子商務環境下幾種典型商品的定價策略研究[D].東北大學,2006.
[2]姚思雨. 改進蟻群聚類演算法在零售客戶分類中的研究與應用[D].大連海事大學,2018.
[3]王學輝. 新零售下X生鮮超市訂單揀選與配送聯合優化研究[D].北京交通大學,2019.
[4]HarigaM A , Al-Ahmari A , Mohamed A R A . A joint optimisation model for inventoryreplenishment, product assortment, shelf space and display area allocationdecisions[J]. European Journal of Operational Research, 2007, 181(1):239-251.
[5]孫淑軍, 傅書勇, 零售商店商品品類陳列決策模型應用分析[J]. 瀋陽工業大學學報(社會科學版), 2010, 3(1):63-65.
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/30407209/viewspace-2850536/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 百分點資料科學實驗室:白酒零售行業商品搭售方案資料科學行業
- 百分點資料科學實驗室:公眾環境滿意度與環境質量的關聯分析研究資料科學
- 百分點認知智慧實驗室出品:深度遷移學習十八問遷移學習
- 百分點認知智慧實驗室出品:TPU與BERT的邂逅
- 百分點科技:《資料科學技術: 文字分析和知識圖譜》資料科學
- 百分點認知智慧實驗室出品:BERT的正確使用姿勢
- 科學實驗室走向全自動化,機器人融合AI,加速科學發現,Science子刊觀點機器人AI
- 百分點認知智慧實驗室:智慧校對的技術原理和實踐
- 解決生命科學研究痛點,北鯤雲端計算著力打造行業解決方案行業
- 百分點感知智慧實驗室:語音識別技術發展階段探究
- 科學甩鍋技術: Typescript 執行時資料校驗TypeScript
- 資料分析與資料探勘 - 04科學計算
- 百分點認知智慧實驗室出品:情感分析在輿情中的研發實踐(上)
- 企業如何進行資料分析,實現科學決策和業務增長
- 亞馬遜雲科技發力醫療與生命科學行業 圍繞資料、算力和體驗加速行業數字化創新亞馬遜行業
- 百分點認知智慧實驗室出品:機器翻譯是如何煉成的(上)
- 百分點認知智慧實驗室出品:機器翻譯是如何煉成的(下)
- Python科學測量與計算庫Pymeasure: 控制你的儀器進行自動測試和科學計算Python
- 實驗室lims系統解決方案
- 之江實驗室:情感計算白皮書
- 打通資料價值鏈,百分點資料科學基礎平臺實現資料到決策的價值轉換 | 愛分析調研資料科學
- (資料科學學習手札136)Python中基於joblib實現極簡併行計算加速資料科學Python
- 銀行大資料分析解決方案,助力銀行零售業務轉型大資料
- 百分點認知智慧實驗室:基於NL2SQL的問答技術和實踐SQL
- 百分點科技感知智慧實驗室:語義分割在水域監控上的應用研究
- 資料庫實驗室挑戰任務-2資料庫
- lims實驗室資訊監控管理系統解決方案
- 計算機實驗室之樹莓派計算機樹莓派
- 百分點認知智慧實驗室出品:基於BERT的問題語義等價新模型模型
- 分類推薦&通俗易懂:資料科學與大資料技術專業領域的實用工具資料科學大資料
- 如何找到企業資源的最佳配比?
- 醫學實驗室資訊管理系統原始碼原始碼
- 業界 | 資料科學家“恐怖故事”資料科學
- 資料科學資料科學
- 虛擬現實、生命科學、科學計算對人類生活的影響都已逐步顯現
- 科藍軟體SUNDB資料庫實力入選人行金融信創生態實驗室《金融信創解決方案(第一批)》資料庫
- 百分點認知智慧實驗室出品:智慧問答中的對抗攻擊及防禦策略
- 百分點科技大資料技術團隊:基於多Spark任務的ClickHouse資料同步方案實踐大資料Spark