谷歌大腦QT-Opt演算法,機器人探囊取物成功率96%,Jeff Dean大讚
量子位 報導 | 公眾號 QbitAI
原創 | 關注前沿科技 量子位
用於工業生產中的普通機器人,往往只會“給雞抓雞,給狗抓狗”,像一個對生活失去了嚮往的流水線工人,重複著日復一日不用動腦的苦勞力。
但,谷歌大腦昨天發了一個新的演算法,讓這些窮苦的機械臂開始從事“腦力勞動”:
從一群物品中,抓起需要的東西。
比如從拼好的積木組合裡,抓單個積木:
所使用的方法是深度強化學習,將大規模分散式優化和新型擬合深度Q學習演算法——QT-Opt相結合,來讓機器人從過去的每一次訓練中學習,獲取經驗。
7個葫蘆娃的4個月修煉
這次訓練的參與“隊員”有7名,他們用10個GPU開始訓練:
每個機器人由一個帶雙指夾具的機械臂和一個RGB攝像頭組成:
為了讓機器人儘快get新的探囊取物技能,谷歌大腦的工作人員準備了1000樣不同的物品用來訓練:
仔細看一眼,其中包括各種形狀、大小、材質不一的物體:
訓練的過程首先從工作人員手動設計的策略開始,逐步切換到深度強化學習模型。
從論文上發現,原理大概是這樣的:
學有所成
經過4個月的訓練後,7位機器人迎來了他們的“考試”:成績不錯,在700次試驗中,機器人找東西抓起來的成功率高達96%,比此前監督學習方法78%的成功率提升了很多。
Jeff Dean覺得它們棒棒的:
除了提升準確率之外,經過QT-Opt演算法訓練過的機器人還主動get了4個新技能:
會破除阻礙
如果目標物體和其他東西連在一起,機器人會主動把它分開然後抓取。
比如前面示範的抓積木,機器人可以把影響自己發力的其他積木推開,再抓自己需要的那塊積木。
“筷功”強
如果碰到難抓的東西,比如外形奇特或是外表光滑的物品,機器人會分析角度,重新定位,然後牢牢抓住不鬆手。
隨手抓也要分析挑選
如果機器人一下子抓住了一堆東西,它可以自己選出需要的物品,在舉起手臂之前牢牢的抓住它。
搶我的一定搶回來
如果人為的把機器人已經抓起來的物體拿掉,它還會鍥而不捨的再抓一遍:
重要的是,以上這些技能都不是人為設定的,均是在訓練過程中,機器人自行get到的。
最後,谷歌還提供了一個視訊,來講述7位機器人盆友的心路歷程...
最後,附論文傳送門~
QT-Opt: Scalable Deep Reinforcement Learning for Vision-Based Robotic Manipulation
作者:Dmitry Kalashnikov, Alex Irpan, Peter Pastor, Julian Ibarz, Alexander Herzog, Eric Jang, Deirdre Quillen, Ethan Holly, Mrinal Kalakrishnan, Vincent Vanhoucke, Sergey Levine
谷歌部落格地址:
https://ai.googleblog.com/2018/06/scalable-deep-reinforcement-learning.html
arXiv:
https://arxiv.org/abs/1806.10293
相關文章
- 谷歌大神Jeff Dean領銜,萬字展望5大AI趨勢谷歌AI
- Google AI負責人Jeff Dean:機器學習讓計算機更智慧GoAI機器學習計算機
- 谷歌拆分搜尋和AI部門:Jeff Dean任AI業務負責人谷歌AI
- 谷歌基情實錄:和Jeff Dean在同一臺電腦上寫程式碼谷歌
- Google大調整:搜尋與AI分家獨立,原SVP引退,Jeff Dean終掌大權GoAI
- 吳恩達、Jeff Dean力薦機器學習新基準MLPerf,由谷歌、百度等聯手打造吳恩達機器學習谷歌
- 谷歌大腦開發機器思維的“人類翻譯器”,打破AI“黑盒”新方式谷歌AI
- Jeff Dean執筆谷歌團隊2017年終總結,乾貨滿滿谷歌
- 《紐約客》特寫Jeff Dean與Sanjay:谷歌唯二11級工程師,同一臺電腦上寫程式碼谷歌工程師
- 加入谷歌25週年,Jeff Dean開啟回憶殺:搬16次工位、掐點打咖啡谷歌
- 機器學習如何解決「看病難」?Jeff Dean等詳述機器學習在醫療領域的應用。機器學習
- Jeff Dean的激盪人生:我和Sanjay在同一臺電腦上寫程式碼
- 谷歌大腦團隊官方推薦 | JavaScript 機器學習領域必讀之作谷歌JavaScript機器學習
- Jeff Dean回憶谷歌趣事:吳恩達激勵自己繼續研究,Hinton曾是最強「實習生」谷歌吳恩達
- 谷歌大腦負責人:深度學習需要至少十萬個樣本谷歌深度學習
- 谷歌大腦神經機器翻譯大規模實驗:尋找最優的超引數組合谷歌
- 機器學習 10大演算法機器學習演算法
- 谷歌開發者大會爐邊談話,Hinton解析AI如何影響人類理解大腦谷歌AI
- “網際網路+機器人”碰撞出啥樣火花? 華數機器人以大資料雲平臺為智慧製造連線“大腦”機器人大資料
- Nature機器學習子刊被諷開歷史倒車,Jeff Dean等數百學者簽名抵制機器學習
- RPA機器人的“三大鐵律”機器人
- RPA機器人的三大優勢機器人
- 新人制作機器人的7大誤區機器人
- Google AI的焦慮:拆分搜尋和人工智慧部門,Jeff Dean任AI業務負責人GoAI人工智慧
- 提高代理IP成功率的三大策略
- 機器學習十大演算法之EM演算法機器學習演算法
- 2018物流機器人七大趨勢(圖)機器人
- 機器學習新手必看十大演算法機器學習演算法
- 大資料 機器學習 演算法概論大資料機器學習演算法
- 大模型111人:谷歌和OpenAI的人才戰爭大模型谷歌OpenAI
- 勒索病毒趁聊天機器人“關停”再掀風浪,360安全大腦率先截殺機器人
- 登上Nature的AI晶片設計屢遭質疑,谷歌發文反擊,Jeff Dean:質疑者連預訓練都沒做AI晶片谷歌
- Jeff Dean親筆:2019年,Google AI又顛覆了什麼?(學術向)GoAI
- 伯克利MemGPT團隊創業,要做開源的OpenAI,Jeff Dean也投了GPT創業OpenAI
- 谷歌大腦提出AutoML-Zero,只會數學運算就能找到AI演算法 | 開源谷歌TOMLAI演算法
- 谷歌瀏覽器開發常用8大技巧谷歌瀏覽器
- 冬奧手記:機器人“大廚”上崗SX機器人
- 初學機器學習必備10大演算法機器學習演算法