作為世界資料探勘領域的最高階別的學術會議,ACM SIGKDD(國際資料探勘與知識發現大會,簡稱 KDD)將於 2019年8月4日—8日在美國阿拉斯加州安克雷奇市舉行。自 1995 年以來,該會議已經舉辦了二十多年,其對論文接收非常嚴格,每年的接收率不超過 20%。今年也是KDD第一次採用雙盲評審政策,評審更為嚴格,Research track的接收率僅為14%。
在如此嚴苛的評審條件下,京東城市憑藉在城市計算領域的學術和行業積澱,依然有6篇重磅論文被KDD2019收錄,展現了AI和大資料前沿技術在智慧城市建設中的應用。
接下來,本文將分享這6篇關於物流人力資源排程、城市細粒度人流量推測、城市交通預測、軌跡資料版權保護、城市的地塊表徵學習、天氣預報精準預測等問題的優秀研究成果。
與往年一樣,本次KDD大會分為 Research 和 Applied Data Science 兩個 track。
據瞭解,今年KDD Research track 共評審了約 1200 篇投稿,其中約 110 篇被接收為 oral 論文,60 篇被接收為 poster 論文,接收率約 14%。
ADS track收到大約 700 篇論文,其中大約 45 篇被接收為 oral 論文,約 100 篇被接收為 poster 論文,接收率約 20.7%。
以下為京東城市本次被KDD大會收錄的6篇論文簡介,想深入瞭解的讀者請檢視每篇論文末尾的原文連結。
1
題目:Efficient and Effective Express via Contextual Cooperative Reinforcement Learning
作者:Yexin Li , Yu Zheng , Qiang Yang
近年來,物流快遞服務覆蓋了越來越多的城市,不僅推動了線上購物的普及,也給城市生活帶來了極大的便利。
當對物流的需求呈逐步增長的時候,運營者通常通過增加快遞員的數量來完成日益增長的配送件任務,但這種方式由於對快遞員的管理排程比較欠缺,從而造成勞動力的浪費,並且不能從根本上解決送取件效率低下的問題。
因此我們提出了一個基於強化學習的優化模型,來實現快遞員的動態排程管理,從而達到只利用一部分現有快遞員來高效完成每天的大量送取件任務的目的。
在一個物流系統中,通常包含兩類任務:
一是配送到達配送站的各個包裹到指定地點;
二是前往客戶實時下單地點收取包裹。即我們平時所說的送件和收件。
基於此,我們本次所研究的優化模型包括兩個步驟:
一是到達配送站的包裹如何分配給每個快遞員;
二是從配送站出發的快遞員,該如何實時規劃他們的工作路徑。
要優化上面的兩個步驟,使得快遞員每天能完成儘可能多的任務,並不是一個容易的問題,需要解決的挑戰難點有三個:
第一個難點是,物流快遞系統非常大,並且是隨時間不斷動態變化的。要同時管理排程大量的快遞員來完成每天大量的送取件任務非常困難。
第二個難點是,在完成第一個步驟時,即如何在配送站分配包裹給每個快遞員,我們需要基於實際情況考慮多個因素:分配給同一個快遞員的包裹有相近的目的地;分配包裹時需要考慮將來可能產生的取件任務;各個快遞員最好有大致相同的任務量,以免造成勞動力的浪費或工作過量的情況。
第三個難點是,對於第二個步驟,即如何實時規劃每個快遞員的作業路線,由於物流系統的動態性質,以及快遞員作業時的一些隨機因素,再加上我們的目標是使得在長時間內完成的總送取件任務數最大,這些都使得傳統的最優化模型並不能很好的解決這個問題。
解決方案
針對以上難點,本文提出了一個基於強化學習的優化模型。針對第一個難點,我們先將城市劃分成了多個獨立的片區,然後分別管理每個片區內的快遞員。
這樣做的原因有兩個:第一,可以很大程度上降低問題的複雜度;第二, 位於城市中距離較遠的兩個片區中的快遞員並不會有協同合作,所以同時考慮整個城市並沒有實際操作上的必要性。
城市片區的劃分是基於已有的Connected Component Detection方法來完成的,最後得到的各個片區滿足相互獨立的性質。
如圖所示,其中每個顏色表示一個獨立的片區,每個片區有一些快遞員在片區內作業來完成送取件任務。
針對第二個難點,我們提出了一個名為Balanced Delivery Service Burden (BDSB)的聚類方法,即對當前片區內的所有包裹,基於它們的目的地來做聚類,得到的每一類包裹分配給同一個快遞員。
針對第三個難點,我們提出了Contextual Cooperative Reinforcement Learning (CCRL) 優化模型,這是一個基於multi-agent 強化學習理論的模型。通過CCRL我們可以對每個片區學習得到一個快遞員的指導策略,來實時規劃各片區內的快遞員作業路線,從而達到最大化長時間內完成的總送取件任務數量的目的。
本文根據歷史物流資料設計了一個物流系統的模擬器,然後在模擬器中訓練以及驗證提出的演算法模型。
論文原文連結:
http://urban-computing.com/pdf/yexinKDD2019.pdf
2
題目:UrbanFM: Inferring Fine-Grained Urban Flows
作者:Yuxuan Liang, Kun Ouyang, Lin Jing, Sijie Ruan, Ye Liu, Junbo Zhang,David S. Rosenblum,Yu Zheng
近年來,城市人流量監控系統在智慧城市當中扮演著重要的角色。然而,細粒度的監控系統需要部署大規模的裝置和感測器,這意味著系統維護需要大量的資金支援。
於是,京東城市聯合西安電子科技大學和新加坡國立大學提出了一種基於深度神經網路的模型UrbanFM (Urban Flow Magnifier),能夠利用粗粒度城市人流量資料準確地還原細粒度人流量資料,從而減少裝置維護成本。
細粒度的城市流量監控系統是現代智慧城市資訊系統中的一個關鍵元件,為城市的長期規劃,實時交通管理等決策提供了基礎的資訊支撐。
這些流量監控系統的感測部分從路沿的監控攝像頭到埋在地下的磁感線圈,再到各大運營商的訊號基站,都在無時無刻為智慧城市的大腦服務。它們就好像是城市的眼睛,將整個城市的實時流量傳輸到控制中心,為大腦中央的管理人員提供一個管理城市的藍圖。
▲1.1 城市人流監控案例
然而,維持細粒度的監控系統的成本不容小覷,考慮到我們需要在城市的大量區域部署這些感測器,最終系統的感測器量級可能會是十萬乃至百萬級別的。維護這樣大量的感測器將需要耗費我們大量的人力以及能源。考慮到全球智慧城市的興起,這樣的人力物力消耗將會更大,甚至可能會阻礙全球的進一步智慧化。
為了減少維護成本,一個簡單的想法是減少感測器的數量,但是這樣也會降低監控系統的粒度進而降低可用性。於是我們提出一個新的想法:“能不能減少監控系統中感測器的數量,但是卻不改變系統所能獲取到的資訊粒度和精度?”
根據以上想法,我們先將整個城市進行柵格化劃分,每個格子代表城市中的一個區域。很明顯,根據不同的劃分方式我們能得到不同粒度的城市人流量資料。例如,圖1.2(b)展示了原有的細粒度某一時刻北京的城市流量圖,而圖1.2(a)是感測器減少後對應時刻的粗粒度城市流量圖。圖中的每一個格子的顏色(熱度值)代表某一時刻該點的流量。我們的目標就是通過粗粒度的城市人流量資料來推斷細粒度的人流量資料。
即給定一個特定的放大倍數和粗粒度人流量圖,來推斷該時刻對應的細粒度人流量圖。
▲1.2 不同粒度城市人流量示例
然而,推斷細粒度的城市人流量需要考慮以下兩個難點:首先,粗粒度流量圖與對應的細粒度流量圖之間具有空間結構性關係。從圖中可以看到,粗粒度的流量圖中每一個大區域(super-region)是由細粒度的幾個小區域(sub-region)組成的,有著空間層次性。在同一時刻中,粗粒度圖的每個大區域的流量等於所有構成該區域的小區域人流量的總和,如圖樣例所示。
所以,我們需要把這種空間層次性反映在我們的模型架構中。此外,不同區域之間也會有空間關聯性,比如鄰近區域的流量應該是相似的,而空間特徵類似的區域流量也會相似。因此,我們需要考慮到空間上的層次性與關聯性來進行模型設計。
其次,除了城市人流量本身資訊,我們還需要考慮外部因素的影響。通常來說,這些外部因素包括天氣,時間,節假日等。比如,圖1.3(a)展示了北京的一個核心區域,我們可以將這個核心區域看成粗粒度的大區域,進一步地將該區域劃分為6*6個細粒度的小區域。每個小區域對應的地理屬性(例如2級路段數目、景點數目等)也在圖1.3(a)當中示出。
我們可以根據這些地理屬性將該核心區域分為住宅區、辦公區和遊客景點等。之後,我們在圖1.3(b)到(e)中繪出了不同外部因素條件下,該核心區域對應細粒度小區域的分佈密度圖。將圖1.3(b)和1.3(d)對比可以看出,工作日雷暴雨的時候,人們會傾向於留在室內辦公區而不是出門在外;再比如,將圖1.3(b)和1.3(c)對比可以看出,人們在週末早上會傾向於公園裡遊玩而不是去公司上班。
單獨來看,這些外部因素會對我們推斷細粒度城市人流量有不可忽視的影響。而且,這些因素還可能因為互相耦合而增加我們分析這些影響的難度。所以,如何考慮到外部因素的影響成為了挑戰之一。
▲圖1.3 外部因素的影響示例
解決方案
從本質來看,推斷細粒度的城市人流量是一個以低資訊熵的輸入推導並恢復高資訊熵的輸出的問題,這和影像超解析度是很相似的。然而,影像超解析度相關演算法並不能考慮到以上提及的難點與挑戰。借鑑了影像復原(包括超解析度、去噪等)的核心思想,即空間特徵提取-高層特徵抽象-根據高層資訊重建的正規化,我們提出了一個基於深度神經網路的模型UrbanFM。
該模型能同時考慮到空間結構性以及外部因素的影響,基於粗粒度的城市流量資料來實時推斷細粒度的城市人流量。該模型的框架如圖1.4所示,此時放大倍數。拆解來看,主要分為推斷網路(Inference Network)和外部因素融合網路(External Factor Fusion)兩個部分。
▲ 圖1.4 UrbanFM整體框架
推斷網路是模型的主網路。首先,它將粗粒度流量圖作為輸入,使用殘差網路(ResNet)進行特徵提取,同時能考慮到區域之間的空間關聯性。之後,將提取出的高階特徵進行分配上取樣(distributional upsampling)來得到每個粗粒度大區域對應的細粒度小區域的分佈矩陣。最後,將原始粗粒度流量圖和分佈矩陣進行按位相乘即可得到細粒度流量圖。
其中,分配上取樣是核心模組,能夠很好的考慮到粗粒度和細粒度人流量圖之間的空間層次性關係。
具體來說,分配上取樣模組先使用Subpixel塊對原始粗粒度圖提取的高階資訊進行上取樣,將特徵圖的尺寸放大倍得到細粒度的特徵圖;再使用一個卷積層和提出的N2歸一化層將放大後的特徵圖轉化為分佈矩陣。這裡的N2歸一化層相比於直接使用損失函式約束空間層次性有幾大優勢。
它是一個無引數層,沒有給網路帶來額外開銷,並且易於實現(如圖1.5所示)。在實驗中,我們也發現使用N2歸一化層比使用損失函式約束空間層次性的效果要好很多。
▲圖1.5 N2歸一化層的實現
此外,我們還設計了外部因素融合模組來綜合考慮所有的外部因素的影響,從而來提升推斷的準確率。外部因素分為離散變數和連續變數。對於離散變數,我們將它們分別進行向量嵌入(embedding)。之後,我們將所有嵌入向量和連續變數拼接作為卷積神經網路的輸入來提取高階表示。最後,將該高階表示分別在推斷網路的不同位置進行融合,如圖1.4所示。
實驗結果
我們使用了四個不同時間段的北京的人流量資料進行了多角度的實驗來驗證模型的效能。此外,為了探究模型的適應性,我們也使用了一個區域性區域(北京歡樂谷主題公園)的人流量資料進行了模型驗證。資料集的細節如圖1.6所示。
▲圖1.6 資料集細節
通過實驗結果可以發現,與領域內領先演算法相比,UrbanFM在北京四個時間段的推斷結果的均方根誤差,平均絕對誤差以及平均絕對相對誤差上的效能表現均有明顯提升。
除了效能表現上的提升之外,我們還能通過對distributional upsampling模組輸出進行視覺化來觀察外部因素對實際推斷的影響。為此,我們選取了位於北京大學附近的一個大區域作為代表,以時間為影響自變數,將7:00到21:00時間段內該區域內對於4*4的小區域的流量分佈展示在圖1.7的GIF中。該區域的左上方是實驗室和辦公區,中間是餐飲區,下方是住宅區。
實驗區域
▲圖1.7 流量分佈矩陣視覺化
首先我們看到工作日的流量圖(第一行)。從圖中可以看到,當模型沒能考慮時間的影響時(UrbanFM_ne, ne 意為no external),所推斷出來的流量分佈近乎於不變,即從早到晚的流量分佈權重一直都集中在辦公區域,而這顯然是符合我們的經驗直覺的。
而當我們的模型把時間的因素給考慮進來後(UrbanFM),可以看到早上的辦公區域的分佈首先是較低的,並隨著時間的推移,住宿區的人流量開始降低,辦公區的流量開始增大, 並在10-11點到達頂峰;這樣流量分佈一直平穩維持直到下午6點的下班時間,隨後辦公區域流量開始減少,人口開始迴流到住宿區。
而對比到週末的流量分佈(第二行),可以看到週末時UrbanFM模型對辦公區區域的所推斷的流量分佈顯著地少於工作日時。這和我們的直覺吻合,即,人們一般在工作日的白天工作而在晚上以及週末時回家休息。
因此,這樣的動態視覺化不僅強調了外部因素對於我們進行細粒度流量推斷的影響,還提高了我們深度學習模型的可解釋性,這樣的可解釋性可以讓我們更直觀地觀察以及分析不同因素對不同地區的流量分佈的影響,為後續的管理和決策提供有力的支援。
關於更多的技術細節,更多的對模型的量化評估以及更多的視覺化分析,歡迎讀者們關注我們的paper以及我們的github。
參考資料:
[1] UrbanFM: Inferring Fine-Grained Urban Flows (KDD, 2019)
Link: https://www.comp.nus.edu.sg/~david/Publications/kdd2019-preprint.pdf
論文原文連結:
http://urban-computing.com/pdf/yuxuanUrbanFMKDD2019.pdf
3
題目:Urban Traffic Prediction from Spatio-Temporal Data Using Deep Meta Learning
作者:Zheyi Pan, Yuxuan Liang, Weifeng Wang, Yong Yu,
Yu Zheng, Junbo Zhang
城市交通預測是城市計算領域中一個非常重要的研究課題,準確的交通預測可以幫助我們更好地理解城市交通,給交通系統的改進提供思路,同時也能對民眾提供及時的城市交通預警。
然而,準確的城市交通預測需解決以下兩個挑戰:
1) 交通資料間複雜的時空相關性,即一個地點的交通狀況會影響其未來一段時間內的交通,也會影響其周圍區域的交通。
如圖2.1(a)所示,當地點S3發生交通事故時,可能導致它相鄰的地點S1,S2,S4堵車;當地點S4有重大事件發生時(例如,演唱會),將有大量的人群湧向S4,從而影響S4未來一段時間的交通狀態。
2) 不同地點間,資料的時空相關性是多樣的,並且這樣的相關性取決於地理資訊,如地點周圍的興趣點,路網結構等。
如圖2.1(b)區域R1、R2和R3擁有不同的POI分佈和路網結構。其中,R1、R3有較多的辦公樓,表示工作區,而R2有較多的住宅,表示一個住宅區。如圖2.1(c)所示,這些區域的POI分佈、路網結構不同,導致,R1、R2、R3三個區域的流入人流量趨勢各不相同。
但同時,由於R1與R3的POI分佈較相似,它們的流量趨勢呈現出一定的相似性。因此,交通預測的核心挑戰就是建模交通資料中的時空相關性和地理資訊對時空相關性的影響。
▲圖2.1 城市交通預測的挑戰
解決方案
為了能在一般化的非規則空間結構上(如路網)預測未來交通,我們首先需要將交通的關聯模式抽象成圖結構。其中,每個點表示的地圖上的地點,而邊表示的是兩個地點間的關聯。接下來,我們提出引數生成的方式,來建模地理資訊對時空相關性的影響。如圖2.2所示,我們用一個模型從節點的地理特徵中,學習節點和邊的特性,而後用這些特性,進而學習時間、空間的關聯性模型。最後用學到的模型進行交通預測。
▲圖2.2
為此,我們引入sequence-to-sequence架構,如圖2.3所示,其中包含:
1. 迴圈神經網路(RNN),將交通資料編碼對映到高維的空間,學習高維特徵。
2. 元知識學習器(Meta-Knowledge Learner)。如圖2.3(b)我們用兩個元知識學習器,分別從點和邊的地理資訊中學習點元知識(Node meta knowledge,NMK)和邊元知識(Edge metaknowledge,EMK),用於生成模型的引數。
3. 基於元學習的圖注意力網路(Meta-GAT)。該網路接收RNN的輸出,用於建模多樣的空間關聯。由於在圖結構中,不同的邊所描述的空間相關性取決於這條邊的特徵屬性,所以,我們用一個元學習器從地理資訊的元知識中學習GAT模型(圖2.3(c))。
4. 基於元學習的迴圈神經網路(Meta-RNN)。該網路接收Meta-GAT的輸出,用於建模多樣的時間關聯性。我們從每個節點地理資訊的元知識中學習RNN的引數,來對多樣的時間相關性建模(圖2.3(d))。
▲圖2.3
實驗結果
最後,我們使用計程車流量預測和道路車輛速度預測這兩個真實的任務來驗證模型的效能。如表2.4所示,從MAE和RMSE這兩個指標上看,我們的模型在使用更少引數的情況下,都要優於之前最好的結果。
▲表2.4
同時我們測試了各個模組的提升效果。如圖2.5所示,在基準模型基礎上,每加上一個模組,模型都能取得更好的結果。應用上所有模組後,模型的預測準確率最高。
▲圖2.5
為了進一步說明深度元學習的有效性,我們對模型所學習到的點元知識進行評估。對於每個節點,其元知識是表徵該節點特性的嵌入向量。一組好的嵌入向量需要能表徵節點之間的相似度。
為此,我們在節點的嵌入空間下(Embedding space),找到每個節點的k鄰近節點。然後,用交通資料的測試集計算每個節點和其k臨近節點的平均相似度。這裡我們選用兩種序列相似度指標:Pearson相關性(CORR)和一階時間相關性(CORT),這兩個值越大,表示相似度越高。如圖2.6所示,用元學習方法學到的嵌入空間,每個節點與其周圍節點的相似度明顯高於在非元學習方法的嵌入空間下節點與其鄰近節點的相似度。
▲圖2.6
最後,我們用一個例項來展現元學習的優勢。在計程車流量預測任務中,我們選取3個典型的區域:永泰園、中關村和三元橋,分別對應於住宅區、辦公區和交通樞紐。然後,我們在嵌入空間下,分別找到它們最近的節點,並且將所有節點所對應的交通流量畫在圖上。圖2.7(a)展現的是非元學習下,每個區域和它在嵌入空間下相鄰區域的流量比較。可以發現,在該嵌入空間下,節點和其相鄰點並不相似。而圖2.7(b)展現的是元學習下的結果,對於每個區域,其嵌入空間下相鄰的區域都跟它有非常相似的流量趨勢,進而說明了元學習方法的有效性。
▲圖2.7
論文原文連結:
http://urban-computing.com/pdf/kdd_2019_camera_ready_ST_MetaNet.pdf
4
題目:TrajGuard: A Comprehensive Trajectory Copyright Protection Scheme
作者:Zheyi Pan, Jie Bao, Weinan Zhang, Yong Yu, Yu Zheng
軌跡資料記錄了人們活動的大量資訊,在城市各個場景中被廣泛使用,如交通預測,興趣點推薦等等,因此很多公司或科研機構向他人公開或售賣資料。但由於軌跡中包含非常多敏感而有價值的資訊,所以有必要構建一種機制來有效監管軌跡資訊的共享和傳播,來識別其他惡意使用者的二次售賣行為,阻止他們非法獲利。
然而,由於惡意使用者可以修改軌跡資料後釋出或售賣,如何在資料被篡改後依然識別資料的版權方,是一個很大的挑戰。
▲圖3.1 軌跡資料的版權保護
另外,由於軌跡資料敏感,沒有公認的第三方機構能夠儲存所有軌跡資料來監管資料的版權資訊,導致版權資訊的真實性難以驗證。
解決方案
為了解決以上問題,我們提出了一個去中心化的軌跡版權保護方案。該方案將版權資訊嵌入到軌跡資料中,使之能夠有效抵禦惡意使用者的攻擊(即在被惡意使用者篡改軌跡資料的情況下,依然能識別出軌跡資料所包含的版權資訊)。
同時,該方案能夠追蹤所有的交易記錄和版權資訊,使任何一筆軌跡交易記錄和已嵌入的版權資訊能夠被驗證。
該版權保護方案主要包含三個部分:1)將原始軌跡在時空網格上切分成若干段子軌跡,並將使用者的版權資訊嵌入到每條子軌跡中;2)對於每一條子軌跡,我們通過調節該軌跡的重心距來嵌入版權資訊;3)用一個區塊鏈去中心化地維護所有軌跡資料交易的版權資訊,使得在沒有將資料交給第三方機構的前提下,方案能夠驗證交易記錄和版權資訊的真實性。
▲圖3.2. TrajGuard系統框架
我們在兩個真實的軌跡資料上測試了我們的方案,實驗結果能夠充分驗證該方案的有效性。
論文原文連結:
http://urban-computing.com/pdf/kdd_2019_camera_ready_TrajGuard.pdf
5
題目:Unifying Inter-region Autocorrelation and Intra-region Structures for Spatial Embedding via Collective Adversarial
作者:Yunchao Zhang, Yanjie Fu, Pengyang Wang, Xianli Li,
Yu Zheng
無監督地理表徵學習主要藉助地塊內部一些有效的地理特徵以及一些結構化的資料來進行地塊的辨別。
已有的一些工作主要藉助圖表徵學習將每個地塊看作一個圖節點或者一張圖來進行學習;這樣的方法很難同時周全地考慮到區域內部的一些結構特徵和區域間的空間相關性。
於是,京東城市聯合密蘇里科技大學和南京大學提出了一種基於無監督協同對抗學習的模型CGAL(Collective Graph-regularized dual-adversarial Learning)來同時建模區域內的結構特徵和區域間的自相關性進行地理區域的表徵學習。
背景介紹
城市的地塊表徵學習主要為了融合學習城市內的多源異構的特徵資料來進行地塊的辨別,這些表徵同時也可以幫助更好的理解城市的結構和動態變化過程,幫助區域規劃,提高城市的管理效率。
但同時,城市中的很多資料都是沒有標籤的,這對很多真實的應用場景帶來很大的挑戰。為此,本文采用深度無監督學習模型來探索地理表徵的學習。同時為了儲存學習時地塊內部和地塊之間的一些特徵和相關性,模型構建了多種結構化的特徵,採用基於自動編碼器的監督協同學習對抗網路進行表徵的學習。
問題描述
本文首先將城市劃分成很對個地塊區域,每個地塊內部有很多建築,POIs分佈,路網,打卡文字資訊,人口流量資訊等。對於每個區域,可以將內部的每一個類別的POI當做一個節點來構造多個圖結構特徵;同時區域之間可以根據:1)文字描述資訊;2)人口流量;3)區域功能三個方面的特徵計算他們之間的自相關性矩陣S。
我們的目標是利用每個區域構建的一些圖結構特徵和區域之間計算的相關性,來學習一個對映函式,該函式能將每個區域的原始高維特徵對映學習得到一個低維空間的表徵向量,該向量能同時儲存有區域內部的結構特徵和區域之間的相關性。
解決方案
模型的整體框架如下所示:
▲圖4.1:CGAL整體模型框架
整個模型框架主要包含三個部分:(1)對每個區域構建多視角圖特徵;(2)利用無監督協同圖正則對抗編碼-解碼網路進行地塊區域的表徵學習;(3)學習得到的區域表徵在人口流量預測任務上的應用。
首先,在每個地塊區域內部構造多視角圖結構特徵,比如,每一類POI當做一個節點,可以計算每一類POI之間的平均距離,得到一張圖,同時每一類POI之間轉移的人口流量可以用來構建另一張圖。
▲多視角特徵圖構建
然後,我們提出協同圖正則對抗自編碼網路來聯合學習區域內的特徵和區域間的關係特徵,具體地,對於每個區域,輸入為內部構建的多個圖結構特徵(地理距離圖、人口流量圖),一種整合編碼方法將多視角特徵聚集學習得到一個隱含的表徵向量,然後分解拆開對映得到原始的多視角輸入。
與此同時,在中間的隱含表徵層,模型提出了利用對偶對抗學習的方法進行隱含表徵向量的正則化,該部分包含兩部分對抗網路:
(1)利用KL divergence最小化學習得到的後驗分佈(隱含向量的分佈)與先驗概率的分佈距離,得到基本的生成對抗網路(GAN)的目標函式表示式,不同於傳統的GAN,這裡是讓隱含特徵分佈逼近設定的一個先驗概率分佈。
(2)利用另外一個生成對抗網路進行隱含向量自相關性的約束正則,任意兩個區域學習得到的隱含向量可以計算得到一個cosine相似度,將這個相似度矩陣和利用已有資料特徵計算得到的相似度矩陣進行逼近。
最後正則化部分的目標函式如下,編碼器作為公用的一個Generator,加上兩個不同的Discriminator,再加上Decoder的還原輸入部分的loss 進行引數的交替迭代優化學習:
最後,每個區域都能學習得到一個儲存了區域內部特徵屬性和區域間相關性的隱含表徵,利用該表徵對區域的人口流入數量進行預測。
實驗結果
文章利用學習得到的每個地塊表徵,建立一個簡單的線性迴歸模型來進行地塊的流行度預測,地塊流行度根據地塊流入人口量計算得到,流量越大,流行度越高。
通過在真實的資料集上進行實驗比較,文章提出的CGAL模型比幾個流行的模型效果都有更好的提升。
▲圖4.3:CGAL模型與其他模型的實驗效能比較
同時,通過對輸入的圖特徵數量的改變,發現多視角的圖特徵作為輸入相較於單視角的圖特徵能有更好的模型效果,這也驗證了構造更多有效的特徵資訊能夠為地塊的表徵學習帶來更多有用的幫助。
▲圖4.4:多視角特徵與單視角特徵的實驗效果比較
在隱含表徵層,當使用人口流動計算得到的相似度進行約束正則時,模型效能效果比使用文字資料和POI資料計算得到的相似度要更好,表明實際的人口流量預測任務與已有的人口流動資料更加相關。
與此同時,利用對偶對抗網路進行隱含表徵層的共同約束正則相比於使用單個對抗網路有著更好的實驗效能,這也驗證了模型提出的在學習地塊區域表徵時應該同時考慮區域內部的特徵和區域之間的相關性這一想法的合理性。
▲圖4.5:使用不同相似指標和不同數量對抗網路的實驗效果比較
參考資料
[1] Unifying Inter-region Autocorrelation and Intra-region Structures for Spatial Embedding via Collective Adversarial Learning
[2] Ensemble-Spotting: Ranking Urban Vibrancy via POI Embedding with Multi-view Spatial Graphs
論文原文連結:
http://urban-computing.com/pdf/yunchao.pdf
6
題目:Deep Uncertainty Quantification: A Machine Learning Approach for Weather Forecasting
作者:Bin Wang, Jie Lu, Zheng Yan, Huaishao Luo, Tianrui Li, Yu Zheng, Guangquan Zhang
天氣預報無時無刻不在影響著我們真實世界中的生活和感受。精準的天氣預報可為居民出行、糧食儲藏、能源預測、產能優化、交通導流、航空航海等諸軍民需求提供更精準的天氣預報以供於決策支援。
傳統的數值天氣預報NWP方法受初始化隨機性的影響,預報往往存在較大偏差;而完全基於歷史資料驅動的機器學習方法則易受資料噪聲的干擾。如何針對氣象要素複雜性、不確定性進行有效建模和準確預報,成為一個極具挑戰性的問題。
解決方案
本文基於序列到序列的深度學習模型,設計了融合多源資訊的神經網路模型DUQ,有效融合了NWP、歷史觀測、氣象站和時刻資訊;針對氣象要素的高度不確定性,設計了具備不確定性量化功能的似然損失函式NLE,用於訓練深度學習模型。
▲圖5. DUQ模型框架
所設計的深度學習方法不僅能夠更準確地進行氣象要素單值預報,也可以對氣象變化範圍進行區間預報。連續9天的天氣預報實驗結果如下表所示,與傳統的數值天氣預報方法相比,該方法能夠降低51.28%的預報誤差。
同時,本研究首次彙報了一個重要實驗觀測:採用所設計的NLE似然損失可以獲得比MAE、MSE結合Dropout、L1和L2正則方法更高的泛化精度。該現象在以往研究中從未被提及,值得進一步深入分析和研究。
論文原文連結:
http://urban-computing.com/pdf/kdd19-BinWang.pdf