DeepETA:優步如何使用深度學習預測到達時間?

banq發表於2022-02-25

Uber神奇的客戶體驗是:準確的到達時間預測 (ETA)。優步使用 ETA 來計算票價、估計接送時間、將乘客與司機匹配、計劃交付等等。
傳統的路由引擎透過將道路網路劃分為由圖中加權邊表示的小路段來計算 ETA。他們使用最短路徑演算法來找到透過圖的最佳路徑,並將權重相加以得出 ETA。
但眾所周知,地圖不是地形:道路圖只是一個模型,並不能完美地捕捉到地面的情況。此外,我們可能不知道特定騎手和司機會選擇哪條路線到達目的地。透過結合使用歷史資料和實時訊號在道路圖預測之上訓練機器學習 (ML) 模型, 
幾年來,Uber 使用梯度增強決策樹整合來改進 ETA 預測。
幾年來,Uber使用梯度增強的決策樹群來完善ETA預測。ETA模型和它的訓練資料集隨著每個版本的釋出而穩步增長。為了跟上這個增長的步伐,Uber的Apache Spark 團隊對XGBoost進行了上游改進,使模型不斷深入,成為當時世界上最大和最深的XGBoost組合之一。
最終,我們達到了一個點,即使用XGBoost增加資料集和模型的大小變得難以維持。
為了繼續擴大模型的規模並提高精確度,我們決定探索深度學習,因為使用資料並行的SGD相對容易擴充套件到大資料集。
為了證明轉向深度學習的合理性,我們需要克服三個主要挑戰:
  • 延遲。該模型必須在最多幾毫秒的時間內返回ETA。
  • 準確度。平均絕對誤差(MAE)必須比現有的XGBoost模型有明顯改善。
  • 通用性。該模型必須在全球範圍內提供ETA預測,包括Uber的所有業務線,如移動和交付。 


為了應對這些挑戰,Uber AI與Uber的地圖團隊合作開展了一個名為DeepE他的專案,為全球ETA預測開發一個低延遲的深度神經網路架構。在這篇博文中,我們將帶領大家瞭解一些幫助DeepETA成為Uber新的生產ETA模型的經驗和設計選擇。
 

原理提要
在過去的幾年裡,人們對將世界的物理模型與深度學習相結合的系統越來越感興趣。
我們在Uber採取了類似的方法來預測ETA。
我們的物理模型是一個路由引擎,它使用地圖資料和實時交通測量來預測ETA,作為兩點之間最佳路徑的分段穿越時間之和。
然後,我們使用機器學習來預測路由引擎ETA和現實世界觀察結果之間的殘差。
我們稱這種混合方法為ETA後處理,而DeepETA是後處理模型的一個例子。從實用的角度來看,透過更新後處理模型來吸收新的資料來源和適應快速變化的業務需求,通常比重構路由引擎本身更容易。

點選標題見原文。

相關文章