本講座選自美國工程院院士、史丹佛大學教授Peter W. Glynn近日在2018第二屆杉數科技AI大師圓桌會上所做的題為《Simulation and Inventory Management: Where, How, When, and Why》的演講。
美國工程院院士、史丹佛大學教授Peter W. Glynn
Peter W. Glynn:
今天我主要是基於相關的研究問題,給大家分享一個觀點——基於資料的決策。為解決各類問題,給大家展示一個由機器學習、人工智慧和其他工具共同搭建的平臺。
我們討論利用模擬來進行決策,尤其是在庫存管理的背景下。機器學習和人工智慧正對世界產生著巨大影響,近幾年的影響可能比過去幾十年的總和還要突出,但這並不意味它們能解決所有的決策問題。而模擬也正在解決令人興奮的決策問題,在決策中同樣舉足輕重。
當今的商業環境給予我們許多機遇和挑戰。一是,更多的資料被收集,如各類資料在店鋪層面、顧客層面和供應鏈層面被收集;二是,資料更加複雜,更多公司參與了零售環節,線上銷售佔據了更大比例,讓人深思未來產業鏈的分配模式和新興科技例如自動駕駛帶來的影響。三是,很多決策過程甚至不需要人類的參與而是自動進行的。四是,對實時決策的需求突出。
最核心的問題是如何利用資料做更好的決策。當然我們都知道,機器學習和人工智慧被廣泛且有效地在這一領域得以應用。
機器學習和人工智慧並不是僅有的途徑,對於特定情境下的問題,機器學習並不適用,尤其是回答一些“what if”的問題時。當過去已發生過類似的例子並收集到大量的資料時,機器學習可以被應用,但很多時候我們沒有足夠的資料,或者無法獲取這些歷史資料,這時候機器學習就沒有那麼有效。
比如,第一個例子,一個零售商想要新建一個自動化的配送中心,來取代現在的人力配送。這是一項花費巨大的工程,所以管理層會想要關心這個中心能幫助提高多少配送時間和顧客滿意度。這不是一個機器學習或者人工智慧可以大放異彩的問題,因為我們正在面臨一個嶄新的決策,並沒有相關的歷史資料能告訴我們這個新技術給公司層面帶來的利益如何。
第二個例子,近年來線上銷售大紅大紫,在零售商利潤中佔據了的很大比例,傳統零售業更多地參與到線上銷售的過程中,他們需要更多地瞭解線上銷售來定位自己線上上銷售中的位置。有一個自然的問題是,線上訂單會給線下商店帶來什麼影響。顯然會有更多的到店訂單,但與此同時貨架上的商品也會減少。這其中也有許多“what if”問題會顯著影響到公司的成功與否。
第三個例子是供應鏈管理中的大危機,例如日本地震時主要的供應鏈被中斷了幾個月,很多工廠、零售商必須連夜之間重新配置供應鏈。這些危機也許在未來會更普遍,因為我們的供應鏈趨向於全球化,因而也更有可能被潛在的危機影響。但是,對於這些問題嚴重缺乏歷史資料,所以機器學習和人工智慧難以適用。
但這些都是模擬可以代替機器學習起到作用的情景。模擬通過利用計算機和計算機實驗來進行決策,主要的想法是建立供應鏈或者庫存管理模型,迅速進行大量計算機實驗來尋找主要會發生的典型情景,尋找出系統發生大變化時產生的主要影響。模擬的作用就是在問題真實發生和決策被實施之前瞭解到它們並及早採取措施。
在現實世界中,大多重要的管理啟發並不是量化的,但在機器學習中我們得到的經驗和啟示都是量化的。對於一個大規模的系統,機器學習的量化資訊可能無法幫助我們理解系統的本身的工作原理,但是模擬也許能讓我們追溯到模型的源頭,瞭解一個供應鏈優於另一個的原因。
想要把一個系統的機理完全用量化的方式來衡量並不是一件容易的事。另外,在制定重大決策或者進行大筆金額投資時,我們傾向於看到各種可能結果的分佈,而不是僅僅一個可能的結果。因為這一結果與隨機發生的事件有關,是一個有特定原因的結果,而我們如何理解這一結果對於如何決策至關重要。
模擬不僅僅能夠補充機器學習完成其不能,同時適用於優化領域。因為優化方法在處理現實問題時,傾向於抽象並簡化很多現實世界中的特點與條件,而執行模擬系統,可以包括更多的細節來驗證優化問題的結論或觀點對於真實世界是否適用。
所有的模擬模型需要資料,我們通過服從指定的分佈生成隨機變數的方式形成資料。例如在分配中心問題中,我們需要運送時間的資料,線下商店需要實現當地客戶需求所花費的時間。其核心問題是如何建立概率模型來進而建立模擬模型。我們想要知道對於一個特定的投資組合的決策有多大的風險,利用計算機來進行模擬是預測風險的一個經典方法。例如模擬並計算未來30天內有巨大財產損失的概率,模擬對於極端事件非常敏感,所以我們想要關注的其實是極端的價格變化,常用的資料統計方法把所有資料視為同等重要來考慮,然而我們考慮的並不是分佈的中間,而是分佈的兩邊(尾部)。同樣在庫存管理中,我們並不是非常擔心典型的供應鏈行為,而更關注5%的極高顧客需求或系統負荷反常行為帶來的影響。這和我們傳統的資料處理和模擬模擬的想法完全不同,蘊含了很多具體有趣的研究問題,正在被我們關注。
另一個研究問題是資料模擬,這個概念在天氣預測中最容易得到解釋。我們得到各種各樣的測量工具和資料,如何通過這些資料更好地預測天氣就是一個核心問題,事實上人們做的事情正是一個初始化的模擬系統,求解一個基於前向時間的微分方程來理解大規模的天氣系統,例如對未來二十四小時某地天氣的預測。這類問題也越來越多的產生於零售業中,同樣有大量不同來源種類的資料,具有不同的可靠程度和穩定性等,如何整合這些資料並做出更好的決策是一個即將變得愈發重要的資料模擬問題。
總的來說,機器學習和人工智慧將會是變革世界的重要科技,但模擬可以作為評估和補充它們的有效工具。