誰說導航一定要用地圖?谷歌DeepMind的強化學習模型靠街景認路
Root 編譯自 DeepMind
量子位 出品 | 公眾號 QbitAI
還記得小時候從家到學校的那段路怎麼走嗎?
那會兒你可能還不知道什麼是地圖,也沒有導航軟體。但那條路的畫面都在腦子裡刻著。茂密的竹林,很多蛇出沒的小山丘,還有泥鰍抓不完的池塘。
這就是我們從小對空間世界感知的途徑,通過路的特徵畫面構建地理認知。
等到慢慢長大了,需要去更遙遠的地方,路上可參考的熟悉的地標越來少,尤其是新的城市時,才開始用起了地圖。
DeepMind團隊希望,造出一個深度強化學習模型,用符合我們直覺的空間認知方式——串聯所有街景畫面,重塑出行導航方式。
使用者只要給定起點終點的地理座標,DeepMind就能結合谷歌地圖裡真實採集的街景資料,訓練出能根據地標畫面資訊規劃出行路線的街景導航模型。
出於保護隱私的考慮,街景中所有的人臉和車牌都會作打碼處理。
比起現有的地圖導航,街景導航的最大優點是非常適合步行,這是因為步行對地理資訊的精度要求更高。
像我們平時去一個地方,大方向上靠高德或百度地圖導航過去沒問題,但最後一公里總是會被帶到各種溝裡去:不是此路不通,就是繞了一大圈。
街景導航的工作原理
傳統的地圖繪製,是讓人繪出路段的二維俯檢視,定位只能參考GPS資訊。而街景的資訊含量更大,更符合我們人置身環境所看到的視覺畫面。
基於這點,DeepMind構建了一個神經網路,把倫敦、巴黎、紐約這些城市的谷歌街景資料,這些依託真實環境的資訊作為輸入源,然後讓模型自行預測每一個可能的前行方向。取樣顆粒度可以達到每一個小道,十字路口,隧道,以及複雜的岔路。
當街景導航模型能順利規劃出前往目的地的路徑時,DeepMind會給予一定的獎勵。然後經過訓練之後,這個街景導航模型能夠逐漸熟悉整個城市的所有路段。
可遷移的模組化的神經網路架構
DeepMind所造的這個街景導航模型包含三個部分:
視覺處理網路:一個可以處理影像和提取視覺特徵的卷積神經網路;
視覺資訊網路:一個專門記憶特定城市街景的迴圈神經網路,可以快速鎖定代表起點終點的實景環境;
路線規劃網路:與特定城市無關的迴圈神經網路,專門負責制定出行路線。
其中,第二個視覺資訊迴圈神經網路是可以替換的,不同的城市可以用不同的網路。而視覺處理網路和路線規劃網路可適用於所有城市。
和城市導航CityNav模型(a)相比,多城市導航MultiCityNav模型是需要有一個針對特定城市路段資訊的視覺資訊模組的,如圖(b)所示。多城市導航MultiCityNav架構的訓練過程可以從(c)看出,模型是怎麼適配其他城市資訊以及遷移相應的路線規劃能力。
和谷歌街景互動介面相似,街景導航模型可以旋轉輸入資訊的觀察視角,或選擇跳到下一個全景鏡頭。
不同的地方在於,街景模型看不到指示方向的箭頭,它需要自己根據畫面中的路徑延伸方向判斷出前行的幾種可能。
如果說目的地是在幾公里以外的地方,那麼街景模型要自己把所有的全景鏡頭採下來的畫面資訊裡的可能走法跑一遍,才能得出結論。
現在DeepMind已經證明了這種多城市街景模型可學習其他新城市的可行性。
作為人類來說,我們不希望這個AI拿到新城市的資料時又要再學一遍怎麼處理街景資訊,比如放大某個可能的岔路口或者在十字路口轉彎等行為。不過花時間在提取新的地表特徵上是可以接受的。
這種方法,獲得新知識的同時也還記得之前所學過的東西,和DeepMind之前連續學習網路Progressive neural network非常相似。
也許等到這個演算法上線應用的時候,我們再也不會遇到跟著地圖導航走卻根本到不了地兒的囧事了。
最後,附論文地址:
Learning to Navigate in Cities Without a Map
https://arxiv.org/abs/1804.00168
你可能感興趣
“寓教於樂”,DeepMind新研究讓機器人從0開始學習複雜精細動作
— 完 —
活動報名
加入社群
量子位AI社群15群開始招募啦,歡迎對AI感興趣的同學,加小助手微信qbitbot6入群;
此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。
進群請加小助手微訊號qbitbot6,並務必備註相應群的關鍵詞~通過稽核後我們將邀請進群。(專業群稽核較嚴,敬請諒解)
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話介面,回覆“招聘”兩個字。
量子位 QbitAI · 頭條號簽約作者
վ'ᴗ' ի 追蹤AI技術和產品新動態
相關文章
- 【強化學習】不用地圖如何導航?DeepMind提出新型雙路徑強化學習「智慧體」架構強化學習地圖智慧體架構
- 沒有地圖也能導航?DeepMind用街景來認路地圖
- DeepMind開源強化學習庫TRFL強化學習
- 強化學習(一)模型基礎強化學習模型
- 無模型的強化學習方法模型強化學習
- 強化學習讓大模型自動糾錯,數學、程式設計效能暴漲,DeepMind新作強化學習大模型程式設計
- DeepMind用元強化學習框架探索多巴胺在學習過程中的作用強化學習框架
- DeepMind釋出神經網路、強化學習庫,網友:推動JAX發展神經網路強化學習
- DeepMind綜述深度強化學習中的快與慢,智慧體應該像人一樣學習強化學習智慧體
- 強化學習(十七) 基於模型的強化學習與Dyna演算法框架強化學習模型演算法框架
- 【強化學習篇】--強化學習案例詳解一強化學習
- 學習技術一定要制定一個明確的學習路線
- Anthropic挖走DeepMind強化學習大牛、AlphaGo核心作者Julian Schrittwieser強化學習Go
- bootstrap導航欄學習boot
- DeepMind利用人工神經網路打造“類腦導航系統”神經網路
- 谷歌論文:使用深度強化學習的晶片佈局谷歌強化學習晶片
- 從入門到精通,Java學習路線導航Java
- 【強化學習】強化學習/增強學習/再勵學習介紹強化學習
- SCoRe: 透過強化學習教導大語言模型進行自我糾錯強化學習模型
- DeepMind開源強化學習遊戲框架,25款線上遊戲等你來挑戰強化學習遊戲框架
- 為什麼說強化學習是一種人工智慧的通用框架?強化學習人工智慧框架
- 乾貨|淺談強化學習的方法及學習路線強化學習
- 誰說用 Git 一定要用命令列?試試 SourceTree 吧Git命令列
- 超越標準 GNN !DeepMind、谷歌提出圖匹配網路| ICML最新論文GNN谷歌
- 強化學習強化學習
- GitHub 導航欄加強Github
- 強化學習-學習筆記13 | 多智慧體強化學習強化學習筆記智慧體
- Oracle官網文件學習路線導圖Oracle
- 深度強化學習day01初探強化學習強化學習
- 【強化學習】強化學習術語表(A-Z)強化學習
- 「AutoML」如何使用強化學習進行模型剪枝?TOML強化學習模型
- 高德地圖導航和路徑規劃地圖
- 強化學習、聯邦學習、圖神經網路,飛槳全新工具元件詳解強化學習聯邦學習神經網路元件
- Android學習進階路線導航線路(Android原始碼分享)Android原始碼
- DeepMind開源強化學習環境,場景靈活介面簡單,推特高贊強化學習
- 構建和優化深度學習模型(神經網路機器識圖)優化深度學習模型神經網路
- 網路安全學習啟航
- 如何高效解決圖相似性學習任務?DeepMind提出超越GNN的圖匹配網路GNN