誰說導航一定要用地圖?谷歌DeepMind的強化學習模型靠街景認路

量子位發表於2018-04-04
Root 編譯自 DeepMind
量子位 出品 | 公眾號 QbitAI

還記得小時候從家到學校的那段路怎麼走嗎?

那會兒你可能還不知道什麼是地圖,也沒有導航軟體。但那條路的畫面都在腦子裡刻著。茂密的竹林,很多蛇出沒的小山丘,還有泥鰍抓不完的池塘。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

這就是我們從小對空間世界感知的途徑,通過路的特徵畫面構建地理認知。

等到慢慢長大了,需要去更遙遠的地方,路上可參考的熟悉的地標越來少,尤其是新的城市時,才開始用起了地圖。

DeepMind團隊希望,造出一個深度強化學習模型,用符合我們直覺的空間認知方式——串聯所有街景畫面,重塑出行導航方式。

640?wx_fmt=gif

使用者只要給定起點終點的地理座標,DeepMind就能結合谷歌地圖裡真實採集的街景資料,訓練出能根據地標畫面資訊規劃出行路線的街景導航模型

出於保護隱私的考慮,街景中所有的人臉和車牌都會作打碼處理。

比起現有的地圖導航,街景導航的最大優點是非常適合步行,這是因為步行對地理資訊的精度要求更高。

像我們平時去一個地方,大方向上靠高德或百度地圖導航過去沒問題,但最後一公里總是會被帶到各種溝裡去:不是此路不通,就是繞了一大圈。

街景導航的工作原理

傳統的地圖繪製,是讓人繪出路段的二維俯檢視,定位只能參考GPS資訊。而街景的資訊含量更大,更符合我們人置身環境所看到的視覺畫面。

基於這點,DeepMind構建了一個神經網路,把倫敦、巴黎、紐約這些城市的谷歌街景資料,這些依託真實環境的資訊作為輸入源,然後讓模型自行預測每一個可能的前行方向。取樣顆粒度可以達到每一個小道,十字路口,隧道,以及複雜的岔路。

當街景導航模型能順利規劃出前往目的地的路徑時,DeepMind會給予一定的獎勵。然後經過訓練之後,這個街景導航模型能夠逐漸熟悉整個城市的所有路段。

可遷移的模組化的神經網路架構

DeepMind所造的這個街景導航模型包含三個部分:

  • 視覺處理網路:一個可以處理影像和提取視覺特徵的卷積神經網路;

  • 視覺資訊網路:一個專門記憶特定城市街景的迴圈神經網路,可以快速鎖定代表起點終點的實景環境;

  • 路線規劃網路:與特定城市無關的迴圈神經網路,專門負責制定出行路線。

其中,第二個視覺資訊迴圈神經網路是可以替換的,不同的城市可以用不同的網路。而視覺處理網路和路線規劃網路可適用於所有城市。

640?wx_fmt=png

和城市導航CityNav模型(a)相比,多城市導航MultiCityNav模型是需要有一個針對特定城市路段資訊的視覺資訊模組的,如圖(b)所示。多城市導航MultiCityNav架構的訓練過程可以從(c)看出,模型是怎麼適配其他城市資訊以及遷移相應的路線規劃能力。

640?wx_fmt=png

和谷歌街景互動介面相似,街景導航模型可以旋轉輸入資訊的觀察視角,或選擇跳到下一個全景鏡頭。

不同的地方在於,街景模型看不到指示方向的箭頭,它需要自己根據畫面中的路徑延伸方向判斷出前行的幾種可能。

如果說目的地是在幾公里以外的地方,那麼街景模型要自己把所有的全景鏡頭採下來的畫面資訊裡的可能走法跑一遍,才能得出結論。

現在DeepMind已經證明了這種多城市街景模型可學習其他新城市的可行性。

作為人類來說,我們不希望這個AI拿到新城市的資料時又要再學一遍怎麼處理街景資訊,比如放大某個可能的岔路口或者在十字路口轉彎等行為。不過花時間在提取新的地表特徵上是可以接受的。

這種方法,獲得新知識的同時也還記得之前所學過的東西,和DeepMind之前連續學習網路Progressive neural network非常相似。

也許等到這個演算法上線應用的時候,我們再也不會遇到跟著地圖導航走卻根本到不了地兒的囧事了。

最後,附論文地址:

Learning to Navigate in Cities Without a Map
https://arxiv.org/abs/1804.00168

你可能感興趣

馬克龍宣佈15億歐元投資AI,DeepMind擁吻巴黎

DeepMind黃士傑:深度學習有創造性,正參與星際2專案

“寓教於樂”,DeepMind新研究讓機器人從0開始學習複雜精細動作

活動報名

640?wx_fmt=jpeg

加入社群

量子位AI社群15群開始招募啦,歡迎對AI感興趣的同學,加小助手微信qbitbot6入群;


此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。


進群請加小助手微訊號qbitbot6,並務必備註相應群的關鍵詞~通過稽核後我們將邀請進群。(專業群稽核較嚴,敬請諒解)

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話介面,回覆“招聘”兩個字。

640?wx_fmt=jpeg

量子位 QbitAI · 頭條號簽約作者

վ'ᴗ' ի 追蹤AI技術和產品新動態



相關文章