毫無疑問這是個令人神往的前景,但首先要面對的嚴酷挑戰是: 機器人如何學會自己解決問題?無法解決這個問題,我們就永遠無法擁有像《傑森一家》中機器女傭蘿西那樣的機器人管家(譯者注:《傑森一家》是著名動畫劇集《摩登原始人》的未來版,描述了傑森一家在未來世界的生活)。目前大多數機器人嚴重依賴於啟發式演算法或是事前編碼的程式來執行任務。Miso Robotic 公司推出過一款機器人叫Flippy,用於在加利福尼亞州帕薩迪納的漢堡店來做肉餅烤制時的翻面工作,Flippy擁有遠比一般工業機器人更為靈活的手臂,但比我們想象中的機器人管家差得還是太遠。Flippy永遠不會知道哄孩子上床睡覺首先該做什麼,就好比它不會做蛋奶酥和蔬菜沙拉一樣。
英偉達公司開發的人工智慧系統SimOpt,向著實現真正的即插即用機器人邁出了堅實的一步——機器人能夠在有限的基本知識或指令下自學技能。它利用強化學習——一種通過獎勵(或懲罰)來驅使人工智慧朝著目標前進的機器學習方法,讓機器人把模擬進行的工作轉化為在現實世界中實際行動,進而完成真正的工作任務。在相關研究中,臉書公司(Facebook)和加州大學伯克利分校(University of California,Berkeley)的人工智慧科學家們利用強化學習得到的模型賦予了機器人"觸覺",擴充套件了它們移動和操縱物體的能力。
監督式學習是另一種機器學習的方法,監督式學習和強化學習結合的技術勢頭很猛,它包括通過代理任務,使人工智慧能夠自主學習,從而達到與監督學習模型相當甚至更好的準確性,而且所需步驟更少。類似的,另一種機器學習方法遷移學習也是如此,遷移學習可以把前一個任務演算法用於解決下一個問題,打個比方,如果一個人學會了騎自行車,那麼他就可以套用經驗來學會開摩托車。
需要清醒的意識到,無論是使用強化學習、遷移學習、半監督學習或是其他什麼機器學習方法,即使是目前最複雜的機器人系統,也遠遠不及人類嬰兒的能力。除了機械的限制,機器學習都是以(具體)任務為導向的,正如前文所提到的,機器人做不到舉一反三,更別提多才多能了。
越來越多的研究機構展開了對非監督式學習的研究,一些專家堅信這是實現人工智慧具備真正自主性的關鍵,拿物件排序問題來舉例,就可以將無監督的資料收集與人工干預結合起來。就其本身而言,Facebook 正在利用部分的無監督強化學習來訓練人工智慧通過重複模擬而不是針對特定任務的模擬來學習技能,但目前還只是很初步的研究。
參考資料
[1]https://venturebeat.com/2019/05/24/ai-weekly-truly-autonomous-home-robots-arent-within-sight-yet/