沒有地圖也能導航?DeepMind用街景來認路

AI科技大本營發表於2018-04-08

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1


譯者 | 王柯凝

編輯 | 明明

出品 | AI科技大本營(公眾號ID:rgznai100)


【AI科技大本營導讀】在童年記憶中,你是如何沿著路線去朋友家、學校或者商店的?那時候沒有地圖,只是簡單的記住街景和沿途轉向。隨著開始嘗試新的越來越複雜的線路,你變得更加自信,在這個過程中,或許你會暫時迷路,但是得益於熟悉的路標或太陽朝向,又能找到正確的路線。因此,導航是一種很重要的認知任務,人類或者動物不需要地圖就能夠在複雜的世界中進行遠距離穿越。


在沒有地圖的城市中學習導航時,我們提供了一個互動式導航環境 —— 使用來自 Google 街景檢視的第一視角並將其環境遊戲化,來訓練人工智慧。作為街景影像的標準,人臉和車牌比較模糊以至於無法識別。我們建立了一個基於神經網路的人工智慧體,使用視覺資訊(來自街景檢視影像的畫素)來學習在多個城市中導航。請注意,這項研究適用於一般導航而不是汽車駕駛,在這裡,我們既沒有使用交通訊息,也沒有對車輛控制建模。


640?wx_fmt=png


圖注:我們的代理導航在多種視覺環境中導航,無需訪問地圖


當代理導航到達目的地(如指定經緯度座標)時,該代理導航就會獲得獎勵,就像一個沒有地圖負責無限交付的快遞員一樣。隨著時間的推移,人工智慧代理以這種方式跨越整個城市進行學習。我們還證明了,代理導航可以在多個城市進行學習,然後適應新的城市。


640?wx_fmt=gif


圖注:代理導航在巴黎訓練的定格影片。影像與城市地圖交疊,目標位置為紅色,代理導航位置和視野為綠色。 請注意,代理程式看不到地圖,它只能看到目標位置的經緯度座標。


無需建立地圖來學習導航


與傳統的依賴指定對映和探索的方法不同(如進行本地化並同時繪製地圖的製圖師),我們的方法是:不使用地圖、GPS 定位或其他輔助工具,只使用視覺觀察,像人類走路那樣進行導航。我們構建了一個神經網路代理,從環境中觀察到的影像作為輸入,並預測在環境中應該執行的下一個操作類似於一些學習在複雜的 3D 迷宮中進行導航以及使用無監督輔助任務進行強化學習來玩遊戲的模型,我們使用深度強化學習對它進行端到端的訓練。與那些小型模擬迷宮環境中的研究不同,我們利用城市中的真實資料:倫敦、巴黎和紐約市的複雜交叉路口、人行道、隧道以及各種拓撲結構。此外,我們的方法支援城市針對性的學習和優化以及通用可轉移導航行為。


可以適用於新城市的模組化神經網路架構


代理導航內部的神經網路由三部分組成:


1)可以處理影像並提取視覺特徵的卷積網路;

2)特定區域的迴圈神經網路,記住環境並學習“ 這裡“(代理當前位置)和”那裡“(目標位置)的表示;

3)基於代理導航行為產生導航策略的區域不變迴圈網路,特定區域模組可互換,並且如其名稱所示,代理導航對於每個城市都是唯一的,而視覺模組和策略模組是區域不變的。


640?wx_fmt=png


圖注:圖 (a) 為 CityNav 體系結構,圖 (b) 為每個城市特定區域路徑的 MultiCityNav 體系結構,圖 (c) 為當代理導航適應新城市時的訓練和轉移過程。


就像在谷歌街景圖相同的是,代理導航可以在適當的位置進行旋轉,或者在可能的情況下前進到下一個全景中;與谷歌地圖和街景不同的是,代理導航不會看到小箭頭、本地或全球地圖或著名的Pegman,而是學習區分開放道路和人行道。目標位置在真實世界中可能是很多公里,這就需要代理導航通過數百個全景圖一步步的找到目的地。


我們證明了該方法可以提供一種將知識轉移到新城市的機制。和人類一樣,當代理導航訪問新城市時,我們會期望它必須學習一組新地標,但沒有必要重新學習它的視覺表現或行為(如沿著街道向前縮放或轉向交叉點)。 因此,使用 MultiCity 體系結構時,我們首先在許多城市中進行訓練,然後凍結( freeze )決策網路和視覺卷積網路,並在新城市中只建立一個新的特定區域路徑。 這種方法使代理導航不會忘記它已經學到了什麼的同時,也能夠獲得新的知識,這和漸進式神經網路架構比較相似。


640?wx_fmt=png

圖注:本研究中使用的五個曼哈頓區域


導航是研究和開發人工智慧的基礎,並試圖在人工代理導航中複製導航可以幫助科學家瞭解其生物學基礎。



原文地址:

https://deepmind.com/blog/learning-to-navigate-cities-without-a-map/



招聘

AI科技大本營現招聘AI記者和資深編譯,有意者請將簡歷投至:gulei@csdn.net,期待你的加入


AI科技大本營讀者群(計算機視覺、機器學習、深度學習、NLP、Python、AI硬體、AI+金融、AI+PM方向)正在招募中,和你志同道合的小夥伴也在這裡!關注AI科技大本營微信公眾號,後臺回覆:讀者群,新增營長請務必備註姓名,研究方向。

640?wx_fmt=gif

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

AI科技大本營公眾號ID:rgznai100640?wx_fmt=jpeg


☟☟☟點選 | 閱讀原文 | 檢視更多精彩內容

相關文章