AI驅動的京東端到端補貨技術建設實踐

DataFunTalk發表於2022-04-16


導讀:自動化是嵌入到整個智慧供應鏈Y的基因裡去的,我們服務的一個願景是希望通過自動化技術實現供應鏈全鏈條的降本提效。本文將分享京東如何利用AI驅動端到端補貨建設,包括以下幾大方面內容:

  • 京東智慧供應鏈現狀
  • AI與OR雙驅動的端到端補貨建設
  • 未來展望

01

京東智慧供應鏈現狀

整個京東集團供應鏈業務分為POP和自營兩部分,智慧供應鏈Y部門80%以上的工作,是服務於自營供應鏈。自營供應鏈是指自己採購、自己銷售,這部分工作主要由Y的技術團隊承接,整個業務體量非常大。

從最近的財報來看,京東平臺的活躍使用者大約5.52億,自營商品超過了900萬種,涵蓋家電、電腦數碼、快銷等所有品類。對接了超過20萬+的供應商,採購不同的商品。整個網路規模非常複雜,基本使用了物流的全部倉庫,通過這種方式更好地提升使用者的體驗、降低成本。通過一系列的供應鏈優化動作,今年Q3財報顯示週轉期達到了30.1天。對標行業來看,處於非常領先的水平,93%以上的自營訂單,實現了24小時達。一方面是因為業務人員的操盤,另一方面是技術服務的加持。


02

AI與OR雙驅動的端到端補貨建設

1. 佈局五大能力

一個商品被消費者購買會有一個非常長的流程,從剛開始的創意設計、研發製造,到最終零售廠商定價交易、倉儲、物流配送、售後,整個鏈條是非常長的。這麼長的鏈條如何去提升效率?需要全鏈條各個環節的優化,我們Y部門在優化過程中佈局了五大能力:

① C2M能力

C2M能力是服務於供應商、品牌商的一個核心,通過行業洞察演算法基於銷售資料,識別出未來哪些是消費者更加青睞的商品,把商品的特性、特質、一些關鍵的屬性,賦能給整個品牌商。品牌商基於洞察建議,做新品的生產和設計。這樣生產商品效率非常高,可以賣得更快、更好。

② 品類規劃

行業內品類規劃的範圍比較廣,主要是品類規劃策略,Y主要聚焦在商品結構和多端選品。

什麼是商品結構?比如京東有900多萬的商品,我們要找出哪些商品是重複的,消費者選擇起來比較困難。這些商品要減少一些自營的讓消費者選擇,把一些更好的商品曝光給消費者。另外也要看哪些商品在自營商品中是沒有的,能不能把這些商品引入京東平臺,讓消費者更好地選擇。

另外多端多渠道選品,京東是一個大平臺,有不同的場域、頻道,不同品質的不同商品,在不同頻道的銷售效率是完全不一樣的。我們希望把不同的商品通過技術識別出來,推到不同的渠道,加速銷售和流轉。

③ 自動定價

Y的一個核心是通過自動的方式實現效率的提升。我們希望未來能實現整個京東平臺的自動定價,給消費者提供更合理的價格,保持比較低的利潤。

④ 智慧庫存

庫存能力是Y比較成熟的能力,從預測、補貨、調撥到清滯的多個環節,佈局了相應能力。

倉網履約

在整個零售供應鏈中,我們希望通過網路的調節,通過履約的優化,實現整個成本和效率的最優化。

--

2. 開展三大類工作

為了實現全鏈條的最優化,我們大部分工作可以歸為三類:

① 第一類是預測類工作,是各類決策和規劃的基礎。

在整個自營的供應鏈中,最核心的就是如何去預測出未來的銷量。因為知道未來銷量,才能決定什麼樣的時機採購。針對銷量預測,我們做得非常成熟。流量預測和財務預測,是為了更好地把銷量計劃做好,把事情做得更加極致。

② 第二類是佈局優化能力。

我們佈局優化的能力是非常充足的。因為優化能力可以幫我們提供更好的決策,比如像在補貨場景下,在什麼時機進多少量,是一個非常明確的運籌優化類問題。

我們想實現整個週轉效率的最佳化,需要把最佳時機和最佳量決策出來,這一塊依賴於運籌能力的搭建。運籌能力的搭建會服務於履約,包括派單優化、履約路線優化,也會有額外的產出。

③ 第三類是模擬平臺。

對於任何一個演算法,在落地上線之前,都要做一輪詳細的評估。模擬平臺是我們完成上線前最後一輪準備的載體。做供應鏈庫存優化的難度非常大,受干擾因素很多,受到前臺因素的影響,如何去評估這種影響?我們建立了供應鏈模擬平臺,通過模擬平臺,模擬各種不同因素的影響,能使我們方案的魯棒性更強一些。模擬平臺在零售內部獲得了創新大獎。

--

3. 庫存管理

庫存是整個供應鏈管理當中最重要的一個部分,也是最難的部分。想把庫存管好,涉及的流程非常長,包括預測,預測得更準,計劃制定的才會更合理。基於計劃和節奏,才能決策出要採多少貨。採完後進入京東大倉,如何調撥到距離消費者更近的倉,提升時效水平。在調撥和採購過程中,還有一些庫存是不容易銷售的,就是滯銷庫存,如何識別滯銷庫存,給出合理的價格,加速消化出去,使得整個週轉效率達到最佳化。

① 庫存管理的核心指標

庫存管理在零售內部服務於三大目標:

  • 週轉的目標,庫存週轉越快,意味著以更低的成本,釋放出更好的現金流,這對企業來說是非常關鍵的;
  • 現貨率,現貨率越高,意味著銷售機會越高,對整個GMV最大化就越好;
  • 滿足率,是指前置倉的滿足率,如果更多的貨從前端發出去,使用者的時效體驗就會更好。比如我們93%以上的貨物都能實現24小時達,這依賴於調撥合理性,讓貨離消費者更近,以更快的速度觸達給消費者。

② 智慧補貨

智慧補貨是其中一個案例,Y以自動化的方式服務於業務,第一個需要挑戰的就是銷量預測。京東的自營商品有900多萬,有1300個倉庫在八大RDC。八大RDC乘以的900多萬商品,將近一億需要預測的數量,規模非常大。在整個預測的沉澱非常成熟後,為了保證預測普適性,現在的預測會輸出未來91天by天、by sku、by RDC的預測,服務於下游的智慧補貨系統。

補貨更多的是要把整個商品從供應商採到京東大倉。每天大概有數千萬的採購建議輸出,將這些貨從供應商自動下單,自動入庫,實現整個自動化流程。當商品進入京東大倉後,要把貨物快速的分配到FDC,在京東內部完成調撥,目前調撥的自動化率高達90%,水平非常高。

③ 智慧清滯

當貨物在京東完成分佈後,一項工作是如何精準地識別出滯銷庫存。我們採購了很多貨,並不是每個貨都好賣,有些貨採購後銷售不及預期,就會成為滯銷,叫做滯銷庫存。我們需要快速識別,並匹配合理的價格,把它銷售出去,這樣週轉效率才能達到最低。京東可以釋放出更多的現金流,讓整個金融更具有競爭力。

目前整個庫存管理是一個全自動化的流程,看起來簡單,但執行難度高。京東自營業務的複雜度高,有全品類商品,不同品類有不同模式,需要匹配不同網路。網路很多時候是會變化的,當發生變化時,每個倉覆蓋的需求也會發生非常大的變化。這對預測的挑戰非常大,比如一個大倉的需求發生很大的波動時,會變得和之前的特性有很大的差異,對預測和補貨會有更多的挑戰。

比如中小件是兩層網路,大件是三層網路,網路由兩層變成三層後,補貨的難度也會增加。在兩層網路時,我們更多是給RDC備貨,但在搭建三層網路的時候,三級網路可以直接去採購,網路之間也可以調撥。這種情況下,網路覆蓋關係變化得更加劇烈,需要採用技術識別出它的變化情況,實時匹配最佳合理的預測方式,給出最佳合理的補貨邏輯。

--

4. 預測

我們的預測目前是智慧預測平臺支援的,它的底層有兩個核心能力:

  • 第一個是大資料的能力;

  • 第二個是成熟的機器學習和深度學習技術。

為了使智慧預測平臺具有更好的適配性,我們會把一些業務的資訊拿到智慧預測平臺裡,比如不同的業態,像大家電是計劃驅動的業態,時尚是期貨的業態,中小件快銷是需求驅動的,需要把不同的業態考慮到預測過程中去。

另外我們會建立不同的影響因子,不同的影響因子對最終效果的影響很大,比如促銷因子、季節性因子,我們把各類因子單獨建模,以方便支撐多種多樣的業務形態,目前智慧預測平臺是支援的。

這一塊目前的主要方向有三個:

  • 第一類是財務預測,幫助業務規劃好財務計劃;

  • 第二是銷量預測,目前非常成熟,是實現自動補貨的基礎,每天輸出千萬行以上的預測建議,千萬行以上的採購行為;

另外是單量預測,更多是服務於物流,做採購的入庫計劃,配置產能。

銷量預測目前更多是服務於兩大業務:

  • 第一是採購業務,從供應商採購進來;

  • 第二是服務於FDC調撥。

① 預測面臨的問題

之前做銷量預測是點預測,比如輸出91天每一天的結果是多少。這種模式在現在的場景下難以滿足需求,所以逐漸從點預測變成分散式預測。我們需要告訴下游系統,每一點的銷量是多少,發生概率是多少,下游基於分佈綜合決策,給出對應的建議。由點預測變成分散式預測,帶來了很大的挑戰,比如算力、計算難度、預測難度的挑戰,都呈指數級的增加。

在現實中想要做好銷量預測,有很多的難點,尤其是在自營供應鏈中。

第一個難點就是客群日益豐富,像Z世代、toB、toG和toC。當服務的人群越多,長尾需求也會越多。本身長尾對預測來說就特別不友好。如何把長尾預測準?在行業內,想先把它做好,難度是很大的。

另外,需要考慮不同商品的生命週期,一個商品從引入到成長到成熟到衰退,整個過程的銷量特性差異非常大。需要精準地識別出不同商品,在不同生命週期下,銷售行為的差異是什麼?把它考慮到銷量預測中去,以提升銷量趨勢的結果。這個是行業內非常大的一個難題,給我們帶來了很大的挑戰。

我們常看到電商平臺現在營銷活動特別多,每個營銷活動都會使得銷量出現一些尖峰,平時就是銷售一兩件的長尾需求,但上了營銷促銷活動,會產生海量爆發的需求。對於平穩序列的預測準確度比較高,非平穩序列預測難度非常大,所以把尖峰預測得更準,對我們來說也是一個挑戰很大的工作。

② 問題的解決方案

為了解決以上問題,我們把整個問題做了拆解:

  • 第一類是時序模型

訓練時序模型在很多情況下,能比較好地解決銷量預測問題。所以這裡一些品類的適應性是相對比較好的。從我們的經驗來看,在趨勢模型上,包括週期性模型,表現效果都比較好,模型能較好地解決這類問題。我們探索的很多場景都可以用時序模型達到比較好的效果。

  • 第二類是機器學習模型

當時序模型解決不了的時候,就需要引入機器學習模型,包括深度學習模型。這種模型解決哪類效果比較好呢?比如促銷、營銷的資訊,複雜的資訊在時序模型中很難考慮進去,因為他的學習能力比較弱。這種情況下,把機器學習模型引入,效果會得到改善。從實際探索來看,XGB、TFT模型都能比較好地解決這些問題,但算力的需求會大幅增加。

  • 第三類是新品模型

新品模型是目前行業的難點,我們也探索了很多新品預測的思路,目前來看沒有特別完美的思路。一種比較可用的思路,是相似品邏輯,會在新品預測中發揮比較大的作用。比如很多商品,在引入平臺後,有些老品和它的相似度非常高,把它引入後,就有相對完善的資料去做新品的模型訓練,效果比較好。

  • 第四類是路由模型

因為上面三種模型是通過演算法人員對商品分析後,針對不同的商品分層做差異化帶來的效果提升,但效率比較低。因此我們提出了路由模型,希望通過演算法的自動識別,自動匹配每個商品在某個時期,有沒有合適的meta model適配。通過一年多的探索,我們找到了一些選擇機制,能很好地匹配商品之間的關係。從實際效果來看,路由模型對大盤精確度的提升發揮了非常大的作用。在不同的頻率上,脈搏的提升是在一個點以上,提升是非常巨大的。所以路由模型是目前重點主推的一個模型,可以提升效率,改善預測的效果。

預測框架

預測框架在整個行業內的做法都差不多,大廠的資料體制非常完善,無論是商品的、使用者的、訂單的、促銷的資料都非常完備。

在完備的資料基礎上,很多工作量在差異化特徵庫的搭建上。如果找到非常好的特徵,匹配很好的資料,可以用相對簡單的模型,達到非常好的效果。比如營銷活動,如何把營銷活動特徵搭建出來。從目前來看,可以把營銷活動資訊作為一個feature,放到模型裡去,但往往模型的輸出效果並不理想。把整個營銷活動拆成價格時序、可售時序合併後,放到已有的模型中,就會達到比較好的效果。所以特徵工程是優秀的演算法工程師發揮作用的工作,當然也是非常難的一項工作。

模型庫、元件庫的搭建是比較成熟的技術。

為了提升演算法上線的效率,我們做了一些機制的完善,包括從去年開始完善了上線流程評估體系、回測體系,極大地加速了預測演算法上線速度。

--

5. 補貨

補貨是一個具有業務屬性的工作,想把補貨做好,一定要理解業務側在做補貨的痛點,只有理解它的痛點,才能把業務的手工補貨,變成現在不斷推進的自動補貨。

① 補貨面臨的問題

像京東900萬的商品,量級是非常恐怖的,如何在合理的情況下,達到一個相對比較好的,大家認可的結果。900萬的商品中爆品並不多,多數都是常規品,產品本身從預測到補貨都很難。在預測不確定性很大的情況下,如何通過補貨模型做兜底,給出很好的效果,是一個有非常挑戰的問題。在做補貨過程中,生意模式非常複雜,網路變化也很多,網路變化時,引數就要自適應地去發生調整,在這個過程中也給我們帶來很大的一個難題。

對我們來說,想把人工補貨變成自動補貨的目的在於:商品種類很多,如果用人去補,效率非常低,工作量很大,並且很難做到精細化。當系統在補貨的時候,可以針對每個SKU做差異化預測,給出差異化的引數,使效果更好。通過這種方式,能把線下手工補貨,變成自動補貨。

目前自動補貨已經達到70%以上的水平,這對我們來說是非常大的鼓舞,使得自動化的效率非常高,給演算法優化提升帶來了更大的空間。

② 問題的解決方案

想把補貨做好,一定要把庫存拆解得更加清晰,針對不同的庫存層次,匹配不同補貨策略和模型演算法。目前我們主要是基於安全庫存模型,對現有的庫存進行拆解。基於庫存模型拆解:

  • 首先是週轉庫存:週轉庫存在理想情況,只需要覆蓋兩次補貨間隔的量就可以。但是很多時候由於供需的不穩定性,供給會發生很大的變化,需求波動也很大,如果只備週轉庫存,會造成斷貨的風險。

  • 其次是安全庫存:為了避免週轉庫存引起的斷貨風險,引入了安全庫存,滿足消費者的需求。比如不同的安全庫存就對應著不同的服務水平,比如現貨率達到97%,增加的安全庫存要遠大於95%的水平。

最- 後是策略庫存:除了週轉和安全庫存之外,還有一些策略庫存。策略庫存是應對一些特殊場景的,比如大促備貨場景,像618和雙11期間,整個節奏受到供應商產能的影響非常大,也會受物流入庫的產能限制。很難在618和雙11前幾天把貨採進來,這個情況下,就要有節奏地把貨引入進來,這部分庫存就是策略庫存。它的量級往往是非常大的,為優化週轉帶來了很大挑戰。

為了應對這種挑戰,目前我們引入兩種常見的補貨策略:

  • 第一類是常規補貨

常規補貨更多的服務於安全庫存和週轉庫存。在這個過程中需要做兩類工作:基於預測的不確定性,推薦出合理的庫存水位,然後基於合理的庫存水位匹配出對應的引數。在引數推薦過程中,目前我們會使用運籌的優化模型給出引數。比如要達到一定的庫存水位,不同的商品要給出不同的引數建議,備貨天數是多少,服務水平是多少。通過常規補貨的引數模型,我們實現了70%的非常高的自動化水平。

  • 第二類是大促補貨

大促補貨是一個非常特殊的場景,因為它的量在某一個時間點爆發得非常大。在這種情況下,我們會基於預測、業務進銷存計劃、物流產能和供應商產能,在長週期下把入庫節奏和數量做一個拆解。這裡的難點有以下幾個:

  • 第一個是銷售預估,我們預測團隊針對大促期間的銷售做了很多的模型優化,從去年到今年618上線,新的大促預測上線後,整個計劃的達成度就有了大幅提升。

  • 第二是入庫節奏的匹配,這一塊更多是和物流測的聯動。

另外很多時候業務會做計劃調整,這種情況下對大促備貨的輸出結果會產生很大的影響。目前通過兩輪試點,我們解決了主要的挑戰。從目前跟進的效果來看,採納率和自動化執行效率是非常高的,大促備貨的採納率在80%以上,自動化率維持在60%以上。

③ 端到端補貨

我們從2020年開始推進一個前沿的技術是多端補貨,前面補貨的核心邏輯是先做預測,再結合補貨模型,比如引數推薦,來下采購單。這種方式的一個劣勢是環節很多,每一層環節都會有一個誤差累積,使預測效果變差。所以我們想把預測和捕獲決策,兩個環節變成一個環節,直接給出最優化的建議,通過這種方式進一步提升補貨的效果。

實現這個理念需要做很多工作,第一步就需要給出歷史上每一次捕獲行為,最佳的捕獲經驗量是多少?通過監督模型去回算曆史上每個採購單最佳的補貨精度是多少。作為一個訓練樣本,給到大模型,通過深度學習訓練的方式給出最佳建議。

在整個端到端的模型裡,會把現在的銷量預測、VLT預測、補貨決策三塊內容,通過一個大的神經網路結合成一個大模型,最終給出建議。為了提升整個模型的可解釋性,會把中間過程的結果,像銷量預測和VLT預測的結果輸出出來,供大家做參考。

從我們驗證效果來看,在實際的落地場景中,我們選了三個具體的品類做線上實驗,實驗效果非常不錯,週轉和現貨能達到雙升,無論對於常規品、暢銷品,都能達到比較好的效果。

之前業務對我們的要求是預測得更準,現在越來越變得是希望我們預測的解釋性更強。不但要有穩定的預測,還要解釋出為什麼今天的預測和昨天的不一樣,或未來有一個峰值,這個峰值原因是什麼。

我們也在不斷地去探索預測的可解釋性,到底怎麼去做?目前我們在探索的過程中,有兩步要走:

  • 第一,預測過程可解釋性,就是做了什麼樣的動作,數量增大了;

  • 第二,結果的可解釋性,對預測總量做拆解,哪些營銷產生的量是因為促銷產生的,哪些是因為價格產生的,需要把結果拆解出來,以方便和業務做事後badcase的追蹤,我們有更好的解釋能力。

④ 採配一體化

採配一體化,預測、補貨、調撥、清滯各個環節是串聯進行的。在這個過程中,因為決策鏈條比較長,節點比較多,一體化決策的技術實踐難度非常大,魯棒性挑戰也很大。隨著技術的不斷完善和進步,未來如何做到一體化決策,是需要攻克的一個課題。我們需要解決的京東場景有采購、調撥行為。調撥包括大倉之間、從大倉到前置倉、從前置倉到大倉的調撥。整個過程中需要考慮的因素很多,週轉、成本、損毀等因素。我們也在探索如何去提升採配產品一體化的水平,加速效率提升。


03

未來展望

我們Y的願景是希望未來實現整個供應鏈的超級自動化,從單點自動化,變成從選品、定價、庫存到履約的全鏈路自動化。

自動化的過程難度很大,從目前來評估,我們更多是在第二階段,一些環節可以深度託管,自動設參、自動出單,有一套完全的自動化流程,達到非常高的自動化水平。未來,我們希望在這個過程中,能無需人工的干預,完全由系統執行全部流程。最後我們希望能實現全領域的自動化,自適應的運營,實現技術更好地服務業務的目標。


04

精彩問答

Q:引入分佈預測,替代點預測之後對於週轉現貨損耗的指標有多少提升,有量化分析的結果嗎?

A:我們之前做過幾輪評測,由點預測切換成分散式點預測後,確實對效果有影響,但具體的量化結果,因為有一些因素,很難給出大傢俱體的值。

Q:請問對高峰期的銷量預測有什麼建議?比如大促的預測,或者一些特別的節假日,或一些突發的事件,該怎麼去做預測?

A:從整個行業來看,大促環節一方面需要做預測,另外一方面需要有計劃。比如業務在做操盤的時候,會給自己設一個目標,目標對預測的影響是很大的。如果業務側銷售目標是十億,在做操盤營銷手段的時候,會朝著十個億目標去。如果能拿到整個銷售目標,把目標考慮到預測的環境中,對預測效果的提升是非常顯著的。尤其在618、雙11、年貨節大的節點上,效果會有非常顯著的提升。

Q:請問端到端的補貨決策模型對資料量等是否有適用條件的要求?端的決策模型在未來會取代預測加補貨優化兩步的流程嗎?

A:首先回答第一個問題,從目前看,我們做的MQRNN的端,一般情況下要求資料集比較大,訓練樣本會在幾十萬左右的水平,如果太小,效果可能不是特別好。

第二個問題,技術的發展是螺旋式上升的,從目前來看預測加補貨優化,它的解釋性會非常強。如果下游是人做補貨的動作,可能更傾向於預測加優化的思路。如果下游沒有特別多的業務同學,預測加優化變成端的方式,在實際落地的時候,阻礙性會更小一些,從長遠來看,端的模型會逐漸取代預測加優化的模型。

Q:策略庫存是綜合考慮大資料預測的不確定性和入庫節奏,與安全庫存本質上的區別在哪裡?

A:策略庫存和安全庫存最大的差異是,有針對性的額外多備一部分庫存。目前我們識別到大促備貨是因為需求波動很大滿足不了。

第一,受限於一些產能,比如用貨量太大,供應商短時間內是沒法生產的。

第二,物流瓶頸的限制,入倉不可能在短期內有那麼大產能都入進來。

在這種情況下,需要差異化,按照節奏把貨前置備進來,這個備貨量往往是遠大於目前滿足銷售的安全庫存水平的,它是一個爆量。這個庫存稱為策略庫存,是因為業務策略和一些操盤的手段,使它的庫存前置進來。策略庫存是在有超額、大量採購的行為下,供應商可能價格更便宜,我可能也更願意多備一些貨,它也是一類策略庫存,這些庫存是可以前置進來的。


今天的分享就到這裡,謝謝大家。

閱讀更多技術乾貨文章,請關注微信公眾號“DataFunTalk”


關於我們:
DataFun:專注於大資料、人工智慧技術應用的分享與交流。發起於2017年,在北京、上海、深圳、杭州等城市舉辦超過100+線下和100+線上沙龍、論壇及峰會,已邀請近1000位專家和學者參與分享。其公眾號 DataFunTalk 累計生產原創文章500+,百萬+閱讀,13萬+精準粉絲。


注:歡迎轉載,轉載請留言或私信。

相關文章