Facebook讓機器人“觀看”上萬次視訊後,TA學會了自主繞道走路
大資料文摘出品
作者:張強、宋欣儀
人類每天都在進行不同層次的規劃活動,比如說每天早上起床以後,你習慣性走到廚房喝一杯咖啡:你會先走下走廊,左轉進入過道,然後進入右邊的房間。
對於這些習慣成自然的流程,你無需思考,不會刻意去想你要使用哪一個肢體動作。但對於機器人而言,這並非易事。
Facebook剛剛釋出了主導研究的新系統,讓機器人也可以通過觀看視訊,拆解動作,並學習如何組合這些動作形成自己的規劃。
已經有越來越多的研究表明,層級抽象結構(即視覺運動子程式)可以提高強化學習中的取樣效率,這是一種利用獎勵驅動智慧體達到目標的AI訓練技術。
在過去,這些層次結構必須通過端到端的訓練來手動編碼或獲取,而這需要大量的時間、注意力和長久的耐心。
Facebook這次的新研究提出,刻意讓機器人通過觀看視訊學習導航,描述一個通過用逆向機器學習模型攝取視訊偽標籤(在本文中,偽標籤指智慧體想象的行為),從而學習層次結構的系統。
論文作者分別來自Facebook AI研究室,加州大學伯克利分校和伊利諾伊大學厄巴納—香檳分校。
論文下載連結:
https://arxiv.org/pdf/1905.12612.pdf
這讓人想起去年Facebook開源的一組模型——Talk the Walk。它只需要360°的全景影像、自然語言以及一張有當地地標(比如銀行和餐館)的地圖就可以通過問路,實現在整個紐約市的街道導航。
具體實現方式
機器人通過觀看這些視訊,研究這些簡單的視覺運動子程式是如何組合以達到高階的抽象層次,這些視覺運動子程式能夠解決一些已知問題,即經典的規劃中的高計算成本和強化學習中的樣本複雜性的問題。
研究者提出的系統分為兩個階段,在第一階段,研究人員通過執行在隨機探索資料上自我監督的智慧體模型生成偽標籤。模型從分佈在四個環境中的1500個不同位置學習,在不同的位置隨機執行30個不同步驟的動作,從而產生45,000個互動樣本。
在系統的第二階段,大約217,000個偽標記視訊被剪輯成220萬個單獨的小視訊,再將其輸入預測參考視訊中相應動作的模型,同時再通過一個單獨的網路檢查參考視訊中的動作序列,並編碼其行為作為向量。另一個模型通過推斷第一幀的軌跡的編碼,來預測哪一個子程式可以呼叫給已有的視訊幀。
在一個部署在辦公環境的真實世界中的機器人實驗中,研究人員表明,相比單純互動的方法,至少應用在之前從未見過的環境上,通過觀看視訊來學習技能(這裡指採用最高效的方式前往目標位置)的方式能達到更好的效果。
最令人印象深刻的是,訓練有素的模型學會了自主地前進導航並避開障礙物,比通過單純互動方式要快4倍,這使得機器人能夠做到完全自主地長距離行進。
“特別引人注目的是,這些模型從總計45,000次的環境互動中學習,”研究人員寫道,“從第一視角的視訊中成功學習,使得智慧體能夠執行連貫的軌跡,即使它只執行過隨機動作。此外,它優於最先進的技能學習技術,該技術需要更大量的訓練樣本,大致1000萬個。”
相關報導:
https://venturebeat.com/2019/05/30/facebooks-ai-learns-how-to-get-around-an-office-by-watching-videos/
論文地址:
https://arxiv.org/abs/1905.12612
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31562039/viewspace-2646866/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 有了這個演算法,在Facebook上看VR視訊再也不怕暈演算法VR
- 這個一瘸一拐的機器人是用樹枝搭的,它自己學會了走路機器人
- 類人型自主機器人會打太極拳,但功夫很弱-史丹佛HumanPlus機器人機器人
- MAGNA:解剖觀看的機會
- Python Selenium實現自動觀看學習通視訊Python
- 定製個機器人幫你和Ta聊天機器人
- 世界首例:一位「00後」讓人形機器人住進了家機器人
- 布魯金斯學會:研究指出機器人會讓人類同事的工作失去意義機器人
- 朱玉可團隊新作:看一眼就能模仿,大模型讓機器人輕鬆學會撒鹽大模型機器人
- 小白觀察:被刪除的 Facebook 賬戶依然會收集你的個人資訊
- TA來了!TA來了!TA帶著獎勵走來了!
- 這是什麼選秀節目?數百萬人看後想學「機器學習」機器學習
- 短視訊帶貨原始碼,觀看視訊時雙擊放大原始碼
- 電視劇《獵毒人》觀後感
- 學了這四招,你在Linux上觀看Netflix影片不發愁Linux
- 上觀獨家 | 專訪“計算機視覺奠基人”:AI改變了科學家發現世界的方式計算機視覺AI
- 2021年1月Twitch和Facebook Gaming觀看時長同比增長了117%GAM
- 當代版木牛流馬?國外網友造出「會走路的桌子」,引百萬人圍觀
- 電話機器人普及會讓電銷人員失業嗎?機器人
- 讓機器人看一眼就能模仿:One-Shot模仿學習發展情況機器人
- 10道機器學習、深度學習必會面試題機器學習深度學習面試題
- AI錯刪YouTube機器人視訊,背後是人類難以消弭的身份焦慮AI機器人
- 智慧對話機器人實戰視訊教程機器人
- CCD視覺上料、機器人擺盤、視覺擺盤視覺機器人
- 讓智慧體像孩子一樣觀察別人學習動作,跨視角技能學習資料集EgoExoLearn來了智慧體Go
- 自媒體短視訊是當下自主創業的最好機會,不容錯過創業
- 華為牽手達闥機器人,瞄準智慧機器人核心技術自主可控機器人
- 【直觀感受中國崛起】5分鐘學會資料視覺化視訊視覺化
- eMarketer:2023年全球手機視訊觀眾將超過27.2億人
- 如果人工智慧在深度學習後再次擊敗人類,人類會被機器人取代嗎?人工智慧深度學習機器人
- 視覺上料系統 柔性振動盤 機器人上料視覺機器人
- 柔性振動盤 視覺上料系統 機器人上料視覺機器人
- 強化學習訓練一兩個小時,100%自主完成任務:機器人ChatGPT時刻真來了?強化學習機器人ChatGPT
- 深度學習、機器學習、python、C++視訊深度學習機器學習PythonC++
- 世界機器人大會上,這家承載「未來養老希望」的國產機器人被包圍了機器人
- 與人類共度一年後,機器人的人生開了掛機器人
- Android 逆向 某視訊直播軟體,破解收費觀看Android
- 在Mac上觀看畫中畫影片,讓你的使用更方便Mac