亞洲唯一!京東榮獲2024年度Gartner供應鏈技術創新獎背後的創新探索

京东云开发者發表於2024-03-14

導語:

2月14日晚間,Gartner公佈了2024年度Gartner Power of the Profession供應鏈大獎,京東集團榮獲供應鏈技術創新獎,成為獲得該獎項的唯一亞洲企業。Gartner Power of the Profession供應鏈獎項已經舉辦十年,是衡量企業供應鏈創新能力的國際權威獎項。據悉,入圍決賽的共有5家企業,另外4家分別是谷歌、思科、MTN集團、Allina Health。京東智慧供應鏈Y業務部研發的“基於機率分佈預測以及解釋性AI的彈性計劃技術”,在激烈的競爭中獲得冠軍,歷年的冠軍包括微軟、輝瑞、殼牌等。此外,幾個月前,京東還憑藉端到端庫存管理等技術入圍了2023年弗蘭茲厄德曼獎(Franz Edelman Award)總決賽,這是一項由美國運籌學與管理科學學會(INFORMS)設立的管理科學界的最高獎項,被譽為工業工程領域的“諾貝爾獎”,旨在表彰運用運籌學和管理科學在實際應用中產生巨大價值的工作。

過去一年,京東零售技術團隊持續探索創新。在供應鏈方向,透過提出並應用端到端庫存管理技術和可解釋AI技術,實現了更快的庫存週轉和更高效的供應鏈決策、協同。近期,我們將推出2023京東零售技術年度盤點的深度文章系列,這是第一篇,希望能為技術同學們帶來一些啟發或幫助。


一、供應鏈決策中的超級難題:如何在保證可解釋性的情況下提升預測精度?

銷量預測是供應鏈決策的關鍵組成部分,其準確性直接影響庫存控制、資金安排、生產計劃和市場策略。銷量預測在傳統上依賴於基於統計方法的時間序列模型,但是隨著計算能力的提升和資料採集技術的進步,預測方法逐漸演變為更為複雜的機器學習演算法,能夠處理更多維度的資料並捕捉更深層次的非線性關係。

總體來看,銷量預測的發展經歷了三個階段:傳統統計方法、機器學習方法以及混合演算法。傳統的統計方法如ETS、ARIMA等,具有清晰的數學結構,但只能處理簡單的時間序列資料,無法捕獲外生變數的影響,很難進一步提高預測精度。隨著電商規模快速發展,商品規模越來越大,傳統方法在複雜場景的效果劣勢則逐漸顯現出來,而機器學習演算法由於其強大的擬合能力開始備受追捧,如 xgboost、LSTM、Transformer等。

然而,目前的機器學習演算法普遍是黑盒化的,可解釋性的缺乏已經成為這些演算法在供應鏈實踐中的一個關鍵障礙。針對傳統方法及機器學習方法的劣勢,混合演算法逐漸走進大眾的視野。混合演算法透過將統計模型與黑盒 ML 演算法相結合以提高預測準確性和可解釋性,如N-BEATS 和 NBEATSx 。但是這些混合演算法存在明顯的問題:一方面,現有的混合演算法與供應鏈場景匹配度低,僅僅考慮趨勢、季節等固有的時序因素,無法量化營銷、促銷等特有因素的影響,因此在供應鏈場景下無法保證可解釋性;另一方面,現有的混合演算法通常依賴於具有統計假設的理論模型,只關注各成分的準確性,不考慮全域性資訊,導致準確性的下降。

而對於京東供應鏈來說,商品補貨的決策直接影響生產,所以對於演算法的要求不僅僅是準確率,而需要有高度的可解釋性,才能獲取業務的信任。尤其是針對頭部商品,會有補貨不足的風險,造成缺貨,影響採銷的銷售計劃達成,所以業務需要知道預測結果是如何得到的,比如預測考慮了哪些因素,每種因素帶來的影響有多大等等,提升業務的可控度及信賴度。京東智慧供應鏈團隊致力於打造一套針對供應鏈場景下全新的可解釋預測演算法,其中如何保證可解釋性的情況下提升預測精度是最主要的挑戰,關鍵要解決兩個技術難點:

(1)高可解釋性約束下現有的演算法準確性較差

在時間序列預測中,基於時序分解的演算法將時序分解為不同的成分,可解釋性較強,因此被廣泛使用,但是基於傳統統計的時序分解演算法由於其無法考慮多序列預測及對於複雜場景的擬合能力較差,所以準確性較差。採用這些方法會造成大量的低質量的備貨及庫存冗餘,增加倉儲成本。因此如何保證可解釋性的情況下提升預測準確率是最大的技術難點。

(2)現有的混合演算法全域性擬合能力差,與供應鏈場景匹配度低

為了提高預測精度,最近的可解釋演算法通常將機器學習方法(ML)與分解相結合,但是現有的混合演算法通常依賴於具有統計假設的理論模型,只關注各成分的準確性,不考慮全域性資訊,而供應鏈場景下各成分的因素相互依賴,採用統計假設的理論模型難以擬合,這種方式脫離了實際的業務場景,從而導致系統使用率較低,補貨不及時等,缺貨導致使用者買不到自己想要買的商品,影響商品的銷售額。

由此,智慧供應鏈團隊提出了一種新的可解釋預測技術,這是一種新的混合演算法,構建了通用的可解釋演算法框架保證高擴充套件性,在不同的複雜場景下可解釋性及準確性均大幅的提升,主要創新包括:

1.預測流程及結果可解釋,大幅提升使用者的信任

新的可解釋預測技術輸出給下游的預測不再是一個最終預測值,預測輸出由多個需求因素組成,如基線、促銷、營銷等,並且基於京東大規模的訂單銷售、促銷等資料,透過因果推斷的方式實現資料到模型輸入及過程的因果邏輯,既提升了複雜場景的擬合能力,同時讓業務瞭解整個預測流程的流轉。比如促銷場景下,透過因果演算法刻畫促銷預測量的上升是由於輸入的促銷資料中業務提報的秒殺促銷引起,從而讓業務瞭解整個預測流程的流轉,最終透過可解釋性的預測指導使用者做出準確的補貨決策,大幅提升使用者的信任。

2.提出了一種通用的結合分解和ML的可解釋預測演算法

智慧供應鏈團隊提出了一種通用的結合分解和ML的可解釋預測演算法(W-R演算法),W-R演算法構建了一種透過加權變體的加法組合函式形成的可解釋加法模型,既透過分解的正規化保證時序的可解釋性,又透過深度的權重及殘差網路考慮全域性資訊提升預測準確性,提升了模型全域性化擬合能力,解決了現有時序分解演算法準確性較差問題。W-R演算法整體分成兩個階段,第一階段是初始分解模組,透過自定義的分解模組去估計分解的成分,保證預測的可解釋性,如在自營場景下:預測 = 基線+促銷+營銷 。第二階段為ML調整模組,透過構建加權變體加法組合函式去擬合初始分解成分的全域性引數,提升預測準確性,自營場景下:預測 = 基線權重*基線+促銷權重*促銷+營銷權重*營銷 +殘差,根據權重及殘差網路估計相應的權重及殘差,最終輸出加權的加法組合預測,總體來看既保證可解釋性,也保證了準確性。

未來來看,可解釋的預測將是供應鏈領域的重點方向之一,後續智慧供應鏈團隊將從全流程可解釋、自動診斷歸因、計劃可解釋等多個方向迭代最佳化可解釋預測技術,從而更好的服務下游決策,提升供應鏈效率。

二、端到端庫存管理的策略和模型設計

庫存管理是供應鏈管理中重要的一環,決策者需要根據使用者需求、銷售計劃和供應商能力等資訊,安排合理的補貨和銷售計劃。實踐中,諸多因素導致庫存管理是一項複雜的難題。例如使用者需求具有高度的不確定性,商品的種類和數量十分龐大,供應鏈中間環節較多,供應商送貨時間和送貨量也有波動性。另一方面,如果庫存管理的決策失準,造成的影響也是巨大的。如果對消費者需求預估不足,導致補貨數量偏低,會造成頻繁的缺貨現象,從而影響消費者購物體驗,也給平臺造成銷售損失。如果過高估計了消費者需求,造成補貨數量偏高,會導致大量的冗餘庫存,產生過高的儲存費用,同時也佔用大量現金流,造成資金浪費。因此,如何應對庫存管理這一既重要又有挑戰的任務,成為供應鏈管理中的首要任務。

傳統的庫存補貨方法大多先基於歷史資料來預估未來需求,再結合供應商補貨提前期(VLT,從向供應商訂貨到收貨完成的時間)等資訊,來確定合適的補貨策略。這種方式被稱為“先預測再最佳化”框架(Predict-then-optimize, PTO)。然而,PTO框架將整個補貨過程拆分為了預測和最佳化兩個階段,而輸入資料經過第一階段處理後往往會造成資訊損失,因此在後續的最佳化階段中無法充分利用原始資料,導致決策偏差。而對於京東場景而言,龐大的商品種類和數量,使用者需求的高度隨機性,各類意外事件(例如惡劣天氣、疫情等)對供應鏈的影響和衝擊,均會進一步提升需求預測中的誤差,最終導致供應鏈成本增加,消費者滿意度下降。

為解決上述問題,京東智慧供應鏈團隊提出端到端(End-to-end)庫存管理技術,基於多分位數迴圈神經網路(MQRNN)演算法,利用商品歷史銷量、歷史採購節奏、供應商履約等資料,直接透過模型來決策最佳補貨量。

該模型先使用歷史採購資料、銷量資料、庫存資料,採用基於動態規劃框架提出的最優補貨量決策模型,確定歷史各個下單時間的最優補貨量;再基於歷史銷量資訊、送貨提前期資訊、下單週期、初始庫存以及最優補貨量構建特徵庫並生成學習樣本;隨後設計基於多分位數迴圈神經網路的深度自學習模組,針對學習樣本進行訓練最佳化;最後基於學習後的深度自學習模組進行預測銷量、送貨提前期以及下單量,實現端到端補貨方法。

如圖所示,端到端模型的輸入項包含5類,分別是需求預測相關特徵、商品基礎特徵(例如品類、品牌、倉庫資訊等)、供應商送貨時長特徵、庫存檔點週期特徵和初始庫存水位資訊。這些輸入資訊經處理後進入隱藏層,包括需求預測子模組、送貨時長模組和最佳化決策模組。模型最終輸出項包括3類,第一項是最終的補貨決策,是模型的主要輸出,第二、三項是同時生成的需求預測結果和供應商送貨時長預測結果。由於縮短了決策流程,減少了中間環節預測誤差累積對決策效果的影響,端到端模型提升了補貨精準度,有效降低成本。


圖 端到端補貨模型示意

這兩項技術上線以來,供應鏈預測準確度提升7%,現貨率提升2%,庫存週轉最佳化接近2天,帶來數億元的持貨成本節約。以這兩項技術為基礎的自動補貨系統,已實現超過85%的自動化率。

目前,京東作為中國最大的零售商,為近6億活躍使用者提供超過1000萬種自營商品。京東自建的覆蓋全國的完善物流體系,管理著超過1600個庫房,運營著超大規模的物流車隊。京東如此龐大的零售和物流業務,背後離不開卓越的供應鏈管理技術,包括庫存管理、庫房運營、配送履約等。得益於完善的供應鏈設施和先進的數智化技術,超過95%的京東自營訂單可以實現當日達或次日達,平均庫存週轉天接近30天,現貨率高於97%,達到了行業領先水平。未來,京東將繼續透過數智化技術持續最佳化成本、效率、體驗,致力於創造更大的產業價值和社會價值。

本文相關的具體技術細節,可分別參考論文:

https://doi.org/10.1287/mnsc.2022.4564

https://arxiv.org/abs/2212.06620

相關文章