來源:滴滴技術
滴滴作為一家共享出行公司,利用資訊科技構建了實時的、智慧的線上交易市場,在這個龐大運轉的市場之中,滴滴秉承著使用者價值至上的宗旨,不斷透過技術提升來實現更高效的運轉效率和更貼心的使用者體驗。
為了使得大家能夠了解線上交易市場及其技術挑戰,開拓技術視野,增進技術交流,故分享本系列文章,完整介紹交易市場策略的各主要領域,分享已有探索經驗,以饗讀者。
本系列文章,雖然涉及較多專業技術,但行文力求概略入門,面向各專業背景,特別是擁有計算機、運籌、交通領域知識背景的朋友。
透過本系列文章,您可以獲得:
1. 瞭解交易市場的核心要素和核心問題,勾勒出交易市場的全景畫面
2. 瞭解滴滴作為出行交易市場所擁有的共性和特性,重點了解網約車交易涉及的主要領域
3. 瞭解交易策略中的各主要領域和技術發展方向,其中包括:
a. 司乘匹配
b. 供需調節
c. 行為推薦
1.什麼是交易市場
2.滴滴交易市場有什麼技術特點?
1)機制設計
2)決策智慧
3)運籌學
4)強化學習
5)因果推斷
3.總結
交易伴隨著人類文明而誕生,從古代的以物換物,到現代的服務貿易,透過有效的交換行為促進了人類社會的不斷前進。交易市場就是為了實現買家和賣家進行交易的一個環境和規則體系。現代交易市場不僅提供了商品或服務的買賣功能,也透過平臺能力為買賣雙方構建更加強健的信任體系和溝通機制,透過公開、透明、公平的交易規則,保障買賣雙方的切身權益,提高整個市場環境的運轉效率,減少資源錯配帶來的社會損失。隨著交通和通訊技術的發展,交易市場不再侷限於特定的地理位置,而是可以透過網路連線世界各地的買家和賣家。特別的,透過計算機技術的普及,尤其是2006年以來新一代人工智慧技術的應用,也使得交易市場可以更快速、準確地進行買賣,實現更高效、更貼心、更合理的市場交易決策,進一步提高了交易的效率和體驗。交易平臺的本質是連線與撮合,它希望將原本較難聯絡的產品或服務的供給方和需求方聯絡起來,實現匹配與撮合,從而提高整個市場運轉效率。從上圖可看出,交易市場中的雙邊參與方越多,則帶來了明顯的網路效應,即:1. 讓產品或服務的供給方能夠面對更多的潛在需求方,從中挑選更加心儀的購買者;2. 讓產品或服務的需求方能夠面對更多的提供者及其差異化產品或服務,從中挑選更加心儀的產品或服務;這一網路效應,提供了更多的可能來提升整個交易市場運轉效率。對此,學術界,特別是經濟學和工業工程領域也有非常多的研究。網際網路時代的線上雙邊市場,將供給方和需求方擴充套件到小區、城市、國家乃至全世界,極大提升了網路效應(Network Effect),帶來了更大的市場效率提升和麵向全社會的體驗升級。· 隨著參與人數增加,網路連線以平方的速度增加,規模迅速擴大· 更大的雙邊市場為交易雙方提供了更多、更好的選擇· 越多的歷史交易行為,可以使得平臺更好預測未來交易行為並提供更優質的服務由於計算機網路技術的加持,資訊透明、實時溝通使得整個交易市場的效率獲得了前所未有的提升,進一步為整個社會的運轉提供了潤滑和改善。2017年,MIT電腦科學與人工智慧實驗室(CSAIL)研發了一套全新的共享汽車排程系統,並做了模擬試驗,試驗從資料上證明了共享汽車在治療城市交通擁堵、提高社會效率上的卓越表現。下圖展現了該方法中如何匹配和排程司機(綠線)來滿足乘客需求(星號),透過模擬研究發現該方法大幅提高了整體交通運轉效率。圖片來自:Alonso-Mora, J., Samaranayake, S., Wallar, A., Frazzoli, E., and Rus, D.: On-demand high-capacity ride-sharing via dynamic trip-vehicle assignment, Proceedings of the National Academy of Sciences, Vol. 114, No. 3, pp. 462–467 (2017)網際網路的出現和快速發展給交易市場帶來了翻天覆地的變化。現如今,交易市場可以被簡單地劃分成兩大類:物品線上雙邊交易市場和服務線上雙邊交易市場。物品線上雙邊交易市場以阿里巴巴、京東、Amazon、eBay等為代表。這些交易市場是透過網際網路平臺連線買家和賣家的,實現商品的展示、交易、付款和配送等一系列流程。這些平臺大多提供了豐富的商品品類,從普通的消費品到高階的奢侈品都可以在這些平臺上找到。當然這些平臺也面臨需要承擔的責任,比如商品質量的信任問題、交易糾紛的處理問題等等。服務線上雙邊交易市場以滴滴、Uber、Airbnb等為代表。這些平臺提供的是服務而非商品的線上交易,比如出行服務、住宿服務、餐飲服務等。這些交易市場利用網際網路平臺連線服務提供者和服務需求者,為使用者提供了更加便捷和靈活的服務體驗。這些交易市場也努力保障服務質量和解決服務安全問題。滴滴作為提供出行服務的線上雙邊交易市場,為全社會提供了關於出行服務的一個交易平臺,這個平臺彙集了數億出行使用者和千萬量級司機,構建了龐大的雙邊交易市場,提供了體驗優秀、多元化、價格合理的眾多出行產品。在滴滴出行構建的這個龐大的線上服務雙邊交易市場之中,在技術方面存在著以下特點:1. 線上線下結合:乘客線上發單,司機線上接單,然後在現實世界中完成出行服務;2. 平臺規則的公正和安全保障:平臺為所有乘客和司機提供透明公開的交易環境,並不斷努力來保障雙方的安全;3. 資料安全和隱私保障:滴滴需要保證司乘的個人資料安全和隱私,採取一系列技術管理措施來保障資料的安全性和隱私性;4. 司機和乘客的體驗:乘客希望更快速的接駕服務和更便宜的價格,司機希望獲得穩定合理的收入,平臺需要努力保障各方體驗;5. 多元化的服務形態:滴滴提供了包括快車、優享、專車、豪華車、計程車等多種服務形態,以滿足不同人群對於出行服務的不同需求;6. 規模龐大的全域性決策問題:當面對如此大量級的交易問題時,大量傳統計算機演算法已經失效,需要積極引入人工智慧、大資料技術,追求更加智慧的智慧決策能力;7. 智慧城市體系中合理的排程和路線規劃能力:透過數字孿生技術,在虛擬環境中模模擬實環境,提早預知並排程出行資源,規劃行駛路線,提高交通利用率,減少擁堵;8. 自動駕駛技術:當面向未來的自動駕駛世界,積極探索自動駕駛技術,以提高出行安全性和服務質量,同時降低運營成本。當面對擁有著龐大而複雜的交易市場時,滴滴交易策略會如何運轉呢?
2007年的諾貝爾經濟學獎頒發給了萊昂尼德·胡爾維茨(Leonid Hurwicz)、埃裡克·馬斯金(Eric Maskin)和羅傑·邁爾森(Roger Myerson)三位傑出的學者,以表彰他們為機制設計理論奠定了基礎。機制設計(Mechanism design,也被稱之為逆博弈論)作為經濟學和博弈論領域的重要分支,旨在透過設計經濟機制或激勵措施來實現特定目標,解決市場環境中的問題。機制設計理論的應用範圍非常廣泛,從市場設計、拍賣理論和社會選擇理論等經濟和政治領域,到網際網路域間路由和搜尋拍賣等技術領域。滴滴交易市場策略的最佳化就是一種廣義的機制設計,旨在根據市場的特點和參與者的需求,設計出合適的交易機制,以實現多方共贏的目標,促進供需兩側受益。決策智慧(Decision Intelligence)
廣義的決策智慧是一門將社會科學、決策理論、管理科學等理論與AI、資料科學相結合的工程學科,它幫助人們利用資料和演算法來在複雜社會系統中做決策,從而改善生活、工作和周圍的世界。在交易市場中討論決策智慧,可以狹義理解為利用運籌學、機器學習、因果推斷和資料科學來做出更好的交易決策,可以舉幾個簡單例子:1. 為乘客出謀劃策,當乘客在有個性化需求的時候,能夠透過哪些車型選擇、價格選擇來實現打到合適的車;2. 為司機出謀劃策,在全天的出車過程中,為司機建議更好的決策行為,規劃最優巡遊路線,實現更好的出車體驗;3. 站在平臺視角,當預測到暴雨來臨的時候,為更加充分滿足乘客未來突發的叫車需求,從全程的現狀和未來預測視角,決策從某個方向更多排程更遠司機;“決策智慧”被著名的技術諮詢公司Gartner評價為正處於快速技術成長期的新興重要技術之一。在滴滴的交易市場環境中,面對複雜的決策問題,我們通常需要進行多方面的決策工作,包括但不限於:實時匹配決策、供需調節決策、乘客司機推薦方案、動態決策、安全和判責決策、增長決策等等。運籌學是近代應用數學的一個重要分支,並在生產、管理等工作中具有廣泛現實應用。運籌學面對現實生活中的複雜問題,利用統計學、數學模型、演算法等方式去尋求最優或近似最優解,因而也被稱之為最最佳化理論。傳統而言,運籌學研究的範疇包括:數學規劃(線性規劃、非線性規劃、整數規劃、隨機規劃、組合規劃等)、圖論、網路流、運輸問題、網路計劃、排隊論、儲存論、對策論、搜尋論、決策分析等領域。隨著萬物互聯時代到來和算力提升,運籌學正在煥發全新的魅力。對於滴滴的複雜場景而言,幾乎所有問題具有現實的複雜性,例如:非常多約束條件下的最最佳化求解、司乘排隊、資源分配等,這些都會依賴於運籌學的形式化數學建模來幫助我們更好解決問題。當然,運籌學並非一顆“銀彈”(Silver Bullet),我們也充分了解到運籌學作為一門非常久遠的學科,存在著諸多落地和發展的現實難點:一方面,將現實問題抽象為數學規劃問題,並透過大型求解器快速求解,是我們追求業務效果最最佳化的有力武器,也讓我們面臨著很多未知探索領域。例如:在使用者開啟相關許可權後,為避免打擾使用者太多次,限制向使用者推薦優惠資訊的總頻次(約束條件),限制推送的間隔(約束條件),最終使得使用者獲得的優惠資訊最優(最最佳化目標)。尤其是,當並不存在唯一最優點的時候,整個收益曲面會構成“帕累託前沿”,我們既可以透過帕雷託前沿上選擇不同的點,來更好滿足使用者的多方面需求(多目標最佳化),又可以透過產品力提升來整體推進帕累託前沿,取得效果提升。上圖來自:Siurana, Maria & Fernández de Córdoba Castellá, Pedro & Montagud, Arnau & Reynoso-Meza, Gilberto. (2017). Modelling and multi-objective optimisation for simulation of cyanobacterial metabolism.另一方面,機器學習——尤其是深度學習——對運籌學帶來了新的機遇和挑戰。傳統運籌學發展中更多強調數學推導和啟發式方法,而深度學習所帶來的強大的學習和運算能力,正在不斷為運籌學注入更多的能量。我們所面臨的大規模運籌問題,大部分很難依賴傳統純數學方法解決,需要結合深度學習方法來實現快速近似求解或更優的約束條件表徵。強化學習(Reinforcement Learning)
強化學習是機器學習領域中與有監督學習、無監督學習並列的第三種基本學習方法,它不需要帶有標籤的學習資料,而是透過自身與環境的不斷探索,來找到使得最終回報最大的決策方法。讓我們思考一下,面對環境的你需要不斷做出動作決策時,如果每步都取當前收益最大的決策,就能獲得整個流程最優,則並不需要使用強化學習,只需要學習單步最優的方法即可。而強化學習所要解決的問題,則是在這類序列決策問題之中,每一步的決策需要為後面行動“留後路”或者“創造更多機會”,從而能夠使得整體更優。以滴滴場景舉例:一位司機在半指派模式(允許選接訂單)的情況下,可能會考慮到“接一單去熱區,那邊未來有更多單子”,在這種思考方式下,每次接單可能都會傾向於“為未來創造更多可能”,從而更容易實現全天收入更高。滴滴平臺利用強化學習解決的問題場景非常廣闊,在各類序列決策問題之中,以不同視角來構建強化學習的Environment、State、Action、Reward,可以獲得不同的演算法結果和策略方式,從而幫助司乘和平臺在一系列序列決策問題中獲得更大的成功。“相關性不等於因果性”——這是2011年圖靈獎得主、人工智慧先驅朱迪亞·珀爾(Judea Pearl)不斷呼籲重視的一點。珀爾在上世紀80年代末將因果模型數學化,改變了社會科學對統計學因果關係的理解,並和加州的邁克爾·喬丹(Michael I. Jordan)教授共同將貝葉斯網路、馬爾可夫網路、機率方法等引入人工智慧,萌發出昌盛的機率圖機器學習模型系列。關於“相關性不等於因果性”,一個簡單的例子莫過於:近年來,大氣中二氧化碳水平和人類肥胖水平持續上升,這種相關性會讓人誤解以為二氧化碳導致肥胖,但事實是,經濟增長使得人類攝入更多食物從而發胖,經濟增長也產生了更多二氧化碳。很多時候我們希望研究的是:當改變了某個行為(通常稱之為 Treatment)之後,會透過因果性造成所希望影響的某個變數的影響是多少(通常稱之為 Effect)。並且,很多時候沒有辦法做完全隨機的對比試驗,拿到準確的平均影響。
這一研究已經擴充到了諸多領域:2021年諾貝爾經濟學獎授予了David Card、Joshua Angrist和Guido Imbens,為了表彰他們建立了一個因果關係研究的新框架,可以利用自然實驗來分析,革新了社會科學領域的實證研究。在滴滴業務中,司乘、平臺會做著不同的決策選擇,從而產生不同的業務結果,如果我們希望能夠更好決策,則不僅需要了解“相關性”,而更應該瞭解“因果性”,透過因果推斷建模來實現對該決策選擇所造成後果的準確預估,繼而提供更好的選擇,保障司乘權益。滴滴作為國內的一家出行平臺,構建了完整的線上交易市場,為司乘雙方全天候提供優質的交易服務。越加複雜的交易市場環境之中,面臨的市場決策挑戰越大。在複雜的交易市場之中,滴滴透過技術進步來不斷提升市場效率和司乘體驗,不斷克服種種技術挑戰,建立公平的平臺規則,提供全面的安全保障,提供多元化的市場服務形態,不斷最佳化交易決策效率,實現多方共贏。以上內容簡要概括了滴滴交易市場面臨的技術挑戰,希望以上內容能夠為您瞭解交易市場提供幫助,後續將帶來具體關於司乘匹配、調節排程、行為推薦等多方面的技術內容。1.Evans, David S., et al. "Platform Economics: Essays on Multi-Sided Businesses." (2011).
2. Pratt, Lorien. Link: How Decision Intelligence Connects Data, Actions, and Outcomes for a Better World. Emerald Group Publishing, 2019.
3. Myerson, Roger B. Mechanism design. Palgrave Macmillan UK, 1989.
4. Is Decision Intelligence The New AI?
5. Kraus, Mathias, Stefan Feuerriegel, and Asil Oztekin. "Deep learning in business analytics and operations research: Models, applications and managerial implications." European Journal of Operational Research 281.3 (2020): 628-641.
6. Sutton, Richard S., and Andrew G. Barto. Reinforcement learning: An introduction. MIT press, 2018.
7. Pearl, Judea, and Dana Mackenzie. The book of why: the new science of cause and effect. Basic books, 2018.
本篇文章作者仲晨,來自滴滴網約車MPT團隊(Marketplace Technology)。團隊致力於打造世界頂尖的智慧交易平臺,包括訂單分配、司機排程、拼車、定價、補貼等方向,透過不斷探索機器學習、強化學習等前沿技術,完善交易市場設計,實現資源最最佳化分配,力求解決正在發生的以及潛在供需失衡的狀況,最大程度滿足平臺多樣化的出行需求,持續最佳化乘客體驗和保障司機收入,提升業務經營效率,引領出行行業變革與發展。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70027824/viewspace-2951186/,如需轉載,請註明出處,否則將追究法律責任。