導讀 隨著大資料的進一步發展,很多企業透過對生產運營資料的管理和規律分析,直接進行管理決策,這在真正的商業場景中,會導致出行決策失誤,因為企業忽視了一個重要問題,那就是簡單的資料規律分析,並不能釋放海量資料的真正價值。那麼如何釋放資料的海量價值,實現從資料到精準決策?下面和大家分享的題目為“資料驅動的生產運營管理決策”,一起看一下杉數科技是如何基於資料實現智慧決策的。
今天分享的內容主要包括四個部分:
1. 資料到管理決策
2. 用什麼資料/指標?——促銷分析
3. 大資料中的小資料——長尾品定價管理
4. 決策質量 V.S. 決策速度——無人倉智慧管理系統
分享嘉賓|何斯邁 上海財經大學 教授
編輯整理|梁傲 本田汽車
出品社群|DataFun
01
1. 資料管理到決策
從資料到管理決策,分為資料、分析和決策三個層次,在資料層,利用IT/資訊管理系統完成資料採集與管理;在分析層,利用統計/機器學習/深度學習/計量經濟/行為經濟等工具進行規律性分析;在決策層,透過運籌最佳化/博弈進行決策建模與求解。運營管理中的資料及決策包含如圖 9 大特徵,這些特徵是很多應用場景中智慧演算法應用的瓶頸所在。面對如此複雜的特徵,當我們在遇到問題時,我們用什麼資料或者用什麼指標去分析這個問題呢?後面將透過具體案例說明。我們以促銷分析為例,說明需要使用什麼資料/指標。在促銷時,零售商和品牌商的決策往往存在促銷效費比低、達成效果差及促銷分析和決策困難的痛點。那針對促銷過程中產生的痛點,其根本原因在哪呢?我們看以下案例。某公司對其主打產品進行了促銷,促銷期內環比產品銷售量增長 57%,促銷期減價 15%,利潤增長 26%。透過對照分析,其競爭對手在此期間未做促銷且銷量基本不變,因此公司初步判斷此次促銷取得非常好的效果。但是基於產品特徵,在回頭看促銷資料時,就會產生第一個問題:銷售增長來自於哪部分顧客的需求?這個產品是固定消耗品(例如電池),且市場被雙寡頭壟斷(例如北美電池市場)。從產品特徵分析,本次多賣的並未來自競爭對手少賣的,因為根據對照情況,競爭對手在此促銷期間並沒有少賣。進一步深入分析會發現比較嚴重的問題,就是促銷期減價導致顧客進行了策略性購買,現在多賣的很可能是來自於與自身未來少賣的,因此促銷效果並不理想。因此我們在做促銷分析的時候,要小心的對產品特徵和資料進行針對性分析。透過對第一個問題的分析,又產生了第二個問題:促銷效果如何?採用什麼資料/評價標準?在這個促銷問題裡,一個很重要的事情就是替代效應,包括物理層面即競品的替代;以及時間層面的替代,即顧客等待促銷再進行購買(淘寶會對未來促銷進行簡訊通知),或促銷會透支未來顧客的購買力及購買慾望。進行替代效應分析時,模型需要考慮替代品定義、價格與銷量、替代維度及推薦位影響等因素,下面看一下替代效應分析都有哪些模型。線上性迴歸與邏輯迴歸模型中,替代參量是產品數量的平方級別,產品數量較多且資料量不足時過擬合問題較嚴重,此外線性模型容易出現比較極端的“最優”決策,因此僅適用於資料質量高、競品少的部分產品的替代效應分析。一個更加適合描述替代行為的模型是選擇模型。使用者對兩個產品的預期價值分別是 和 ,不同的客戶還存在一個獨立隨機的偏好值 ξ,那麼客戶選擇兩個產品時,會根據預期價值和偏好值進行選擇,當 ξ 滿足一定的分佈假設時,客戶選擇產品 1 的機率就是 ,其中 為不選擇兩個產品的期望價值,這樣就會產生自然的替代效應。基於獲得諾貝爾經濟學獎的前景理論,顧客會根據產品歷史價格形成一個參考價格,當產品價格偏離參考價格幅度特別大時,顧客並不敏感,僅當產品價格接近參考價格時才會比較敏感,這就是參考價格模型,它可以較好地刻畫時間層面的替代效應,提升多週期產品價格決策的擬合效果。此外還有進階選擇模型,比如巢狀 Logit 模型、馬爾可夫鏈模型及吸引力模型,都可以實現不同因素下的替代效應分析。在進行促銷評價時,常見的指標為轉化率。比如在進行減價促銷時,減價效應和廣告效應是結合的,如果要評價減價效果,就需要去掉廣告效應,因此轉化率作為促銷效果評估指標是一個自然的選擇。但在實際減價促銷時,會出現一些促銷產品的 PV 大幅上漲,而產品的轉化率卻下降,但同時確實也有減價行為,那就會產生一個疑問:這是不好的促銷嗎?下面我們來看促銷案例二。公司對商品進行大幅減價促銷,銷量、利潤、銷售額都增長了,初看上去是很好的促銷。但是如果分析轉化率,轉化率卻大幅下降,使得促銷效果看上去並不理想。這個現象的原因是促銷時大量的廣告宣傳,帶來顧客數暴增和銷量增長。但是從顧客構成分析,其實是促銷期內大量新客戶的湧入,造成顧客群體從忠誠度較高的老客戶為主變化為對產品不太瞭解的新客戶為主。兩類顧客的轉化率都因為減價促銷大幅上升了,但由於新客戶基礎轉化率顯著地低,造成促銷後的整體轉化率反而降低。這個在統計理論中是經典的辛普森悖論。在這種情況,就需要對顧客分群后進行轉化率分析,同時拆分引流效果,除此之外還要考慮新老轉化率,因為現在來的新客戶未來可能會成為老客戶,對企業來說也至關重要。因此在促銷決策,進行效果評估時需要考慮替代效應、指標及對比,進行決策時需要考慮選品、轉化率及決策風險控制。在某寵物產品智慧促銷最佳化、某快消巨頭智慧促銷最佳化、某鞋類品牌促銷最佳化等多個實踐專案中,採用上述促銷決策,均取得了良好的促銷效果。
為什麼會面臨大資料中的小資料?因為很多時候雖然資料量大,但是在真正決策時,取得的效果並不那麼好,下面將以長尾品定價管理作為典型案例進行說明。下面我將講解和某電商平臺合作的一個定價專案,希望透過定價來實現促銷來最大化,增加收益和利潤。這個專案涉及千萬級 SKU,同時需要面對快速增長的業務和複雜的折扣結構。傳統管理中管理者依靠手動調價管理非常多的 SKU,只能專注於核心產品,對於長尾品對調價很少。所以專案希望透過半自動化的工具,可系統地為大多數 SKU 提供定價建議,並識別錯誤的價格。經典定價理論,透過時間序列模型、行為模型、機器學習、深度學習來去除其他因子的干擾,計算價格彈性得到量價關係圖,然後去進行決策,但在解決實際問題時,將會面臨以下三個課題。比如某電商產品,由於促銷打折、滿減優惠等活動的疊加,且不同訂單可能參加不同的優惠活動,導致頁面價格和最終成交價格存在巨大差異,這時產品的真實成交價格就很難判定,更無法精準判斷競品的價格。顧客數量對銷量起到決定性因素,但顧客數量卻受廣告影響,尤其線上上平臺。而不同的廣告頁面位置也會對顧客數量產生顯著的影響,而大部分電商平臺缺少廣告位置記錄,僅記錄了 UI 的數字化 ID。如果 UI 設計沒有儲存,僅透過 ID 是無法知道廣告的具體位,更無法評判廣告位對顧客數量的影響。而且廣告往往會疊加大幅折扣活動,這種疊加效應下更難以單獨分析廣告效應。對於暢銷商品,有較好的整體資料質量,但面臨較低的平臺定價權、較高的競爭水平、競爭對手資料不足、較複雜的消費者行為,因此作為自動定價的目標產品阻力重重。對於長尾商品,平臺有較高的定價權較,產品面臨較低的競爭水平、較簡單的消費者行為,較高的單品利潤率,因此產品管理團隊對自動化定價的接受意願較高,但也面臨資料質量差、大量非標商品、替代關係不明的困難。2. 長尾商品的收益管理
長尾商品因為具備資料質量差、大量非標商品、替代關係不明等缺點,所以單個產品看不到任何規律,但對一些產品進行分組,會發現各類產品之間的有相近趨勢性。因此我們首先按商品特徵進行分組,對組內不可預測的共同因素,借鑑金融工具進行對沖,對不確定引數進行魯棒最佳化模型,同時透過探索與學習,逐步提高決策範圍,整個模型在此次專案的商品調價中取得了良好效果。前面的模型完成了一些容易處理商品的定價,為了進一步模型實現覆蓋率提升,透過分組定價模型,來降低整體決策風險,對於新品或長尾品,引入了關聯學習模型,對於無調價記錄產品,透過隨機調價模型去獲取有用的價值資訊。考慮到線上、線下商品,顧客對的價格變動的感知程度不一樣,線下客戶因為資訊獲取的難度提升對於減價效應會有顯著的滯後效應,所以定價時也會對使用者感知度進行關注。怎樣實現決策質量和決策速度之間權衡,下面將透過和京東合作的無人倉智慧管理系統專案進行分享。1. 專案背景
京東無人倉採用 AGV 去貨架把貨物取到工作站,這個過程中需要儘量滿足各個工作站商品出庫量要求,同時保證出貨架儘量少和搬運成本儘量低,而且 AGV 數、貨架數、工作站數及每個工作站處理的商品種類數都巨大,所以核心問題是在有限時間內完成貨架、AGV、工作站的多重匹配,難點在於問題是典型的 NP-難問題、而且存在百萬以上變數/約束、可行計算時間有限(2-3秒)。整個專案求解的最終目標就是最小化 AGV 執行總距離(時間)及未滿足訂單產生的等待費用。作為一個三元匹配問題,同時涉及多因素百萬級變數問題模,解題的瓶頸在於求解時間與求解規模的矛盾。透過對數學模型分析發現,存在一個交叉約束條件,導致形成三元匹配問題,如果將此約束條件刪除,就可以將三元匹配問題拆分為兩個二元匹配問題,所以解提思路為將其轉換成分離問題。我們採用拉格朗日乘子法把交叉約束拆分到目標函式上去,實現分離問題與降維。透過問題拆,把原先複雜的三元問題拆分成兩個問題:①固定 y 和 z 變數對 x 的簡單匹配問題;②固定 x 變數對 y 和 z 匹配問題。問題①可採用線性規劃或匈牙利演算法求解,問題②的規模比原問題降低大約 75%,結構也變的更加清晰,解題難度大大下降。當原問題拆分成兩個問題,如何保證拆分後的問題與原問題不存在差異,這就要求解Λ最優值,且不能單獨求解問題①和②。我們透過線性鬆弛問題求解高質量的Λ,再求解問題②,最終求解帶關聯約束的問題①,滿足了這兩點要求。整個演算法的求解效果,與 CPLEX 相比,在大規模問題求解上,解題質量提高3%- 40%。雙十一期間在京東無人倉對這個演算法進行了實際測試,在訂單處理量、商品處理量及單人處理量上對比常規倉庫均有大幅提升。針對無人倉智慧管理系統專案,同時分享一下幾個擴充套件經驗:對於超大規模倉的處理,採用均衡分割槽;對於 AGV 路徑規劃,採用防碰撞+加減速限制及時空網路中的 MVRP;對於對偶參量的訓練與學習,利用倉庫狀態標籤採用機器學習/深度學習技術學習。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70024924/viewspace-2933592/,如需轉載,請註明出處,否則將追究法律責任。