能獨當一面的家用機器人,什麼時候才會出現?

藥明康德AI發表於2019-05-28

能獨當一面的家用機器人,什麼時候才會出現?

人類社會的未來或許真的會印證著名科幻作家艾薩克 · 阿西莫夫的小說中那些奇妙的想象和預言,當然,指的是其中好的那些。關於未來世界廣為人知的描述有很多,其中之一就包括機器人管家將無微不至的照顧我們的日常生活,比如如洗碗、疊衣服和遛狗。機器管家會照顧我們的孩子,取代護士和助理醫師在診所和醫院中的角色,還會為每個人的三餐定製個性化的飲食計劃。

毫無疑問這是個令人神往的前景,但首先要面對的嚴酷挑戰是: 機器人如何學會自己解決問題?無法解決這個問題,我們就永遠無法擁有像《傑森一家》中機器女傭蘿西那樣的機器人管家(譯者注:《傑森一家》是著名動畫劇集《摩登原始人》的未來版,描述了傑森一家在未來世界的生活)。目前大多數機器人嚴重依賴於啟發式演算法或是事前編碼的程式來執行任務。Miso Robotic 公司推出過一款機器人叫Flippy,用於在加利福尼亞州帕薩迪納的漢堡店來做肉餅烤制時的翻面工作,Flippy擁有遠比一般工業機器人更為靈活的手臂,但比我們想象中的機器人管家差得還是太遠。Flippy永遠不會知道哄孩子上床睡覺首先該做什麼,就好比它不會做蛋奶酥和蔬菜沙拉一樣。

能獨當一面的家用機器人,什麼時候才會出現?英偉達公司開發的人工智慧系統SimOpt,向著實現真正的即插即用機器人邁出了堅實的一步——機器人能夠在有限的基本知識或指令下自學技能。它利用強化學習——一種通過獎勵(或懲罰)來驅使人工智慧朝著目標前進的機器學習方法,讓機器人把模擬進行的工作轉化為在現實世界中實際行動,進而完成真正的工作任務。在相關研究中,臉書公司(Facebook)和加州大學伯克利分校(University of California,Berkeley)的人工智慧科學家們利用強化學習得到的模型賦予了機器人"觸覺",擴充套件了它們移動和操縱物體的能力。

即便是目前最前沿的強化學習技術也並不是特別靈光——比如,在英偉達的 FleX 物理模擬引擎中,訓練 SimOpt 需要9600次兩小時規模的模擬。但是隨著分散式計算的普及,不難想象時長將會大大縮短。在算力強大的雲端計算人工智慧加速器上可以針對特定的場景來做模擬(例如切菜),直到精度達到最低要求,然後將所得的演算法轉移到現實世界的機器上。通過這種方式,機器人將會迅速的掌握全新技能。

監督式學習是另一種機器學習的方法,監督式學習和強化學習結合的技術勢頭很猛,它包括通過代理任務,使人工智慧能夠自主學習,從而達到與監督學習模型相當甚至更好的準確性,而且所需步驟更少。類似的,另一種機器學習方法遷移學習也是如此,遷移學習可以把前一個任務演算法用於解決下一個問題,打個比方,如果一個人學會了騎自行車,那麼他就可以套用經驗來學會開摩托車。

最近,由普林斯頓大學、哥倫比亞大學和谷歌組成的團隊印證了將多種技術結合起來的強大力量。團隊開發了一款名為TossingBot 的機器人,TossingBot可以學習如何抓取物體並把它們扔進盒子裡。 經過14個小時的10000次抓握和投擲嘗試後,TossingBot 從一堆雜物中準確抓取目標物品的成功率達到了87%

需要清醒的意識到,無論是使用強化學習遷移學習、半監督學習或是其他什麼機器學習方法,即使是目前最複雜的機器人系統,也遠遠不及人類嬰兒的能力。除了機械的限制,機器學習都是以(具體)任務為導向的,正如前文所提到的,機器人做不到舉一反三,更別提多才多能了。

越來越多的研究機構展開了對非監督式學習的研究,一些專家堅信這是實現人工智慧具備真正自主性的關鍵,拿物件排序問題來舉例,就可以將無監督的資料收集與人工干預結合起來。就其本身而言,Facebook 正在利用部分的無監督強化學習來訓練人工智慧通過重複模擬而不是針對特定任務的模擬來學習技能,但目前還只是很初步的研究。

講了這麼多,就是想指出現實生活中還不太可能用上科幻世界中那樣的機器人。撇開單位經濟效益不談,距離造出功能強大的機器人依然存在巨大障礙。 頑強的研究人員不會就此放棄,他們的工作無疑將在製造業中產出累累碩果。 不過在短期內,就不要指望你的下一個快遞會由機器人送上門並且還和你聊上那麼幾句了。

參考資料

[1]https://venturebeat.com/2019/05/24/ai-weekly-truly-autonomous-home-robots-arent-within-sight-yet/

相關文章