科學家教會機器人用嬰兒的方式來學習

發展心理學家和電腦科學家之間的一項合作研究表明機器人可以像嬰兒一樣學習——透過體驗這個世界，並且最終可以模仿人類。

嬰兒透過身體在空間中的運動、抓取玩具、將物體推下桌子、觀察和模仿成年人的行為來學習這個世界。但是當機器人專家想要教會機器人如何完成一個任務時，他們會選擇寫程式碼或者移動機器人的手臂或者身體來告訴它們如何完成一個動作。華盛頓大學發展心理學家和電腦科學家之間的一項合作研究表明機器人可以像兒童一樣學習——即透過探索來積累資料、觀察人類完成任務的方式、然後決定如何能更好地完成任務。「你可以把這看作是機器人學習人類的第一步，就像嬰兒從成年人學習的方式一樣。」華盛頓大學電腦科學與技術學院Rajesh Rao教授說。「如果你希望完全不懂電腦程式設計的人來教機器人，唯一的方法就是親身演示——如何清洗盤子、如何疊衣服、以及如何做家務等。但是為了實現這個目標，你需要讓機器人理解這些行為，並且讓它們自己也能做這些。」該研究將華盛頓大學「學習與腦科學實驗室(I-LABS)研究所」的兒童發展研究與機器學習方法結合起來，發表在《PLOS ONE》雜誌上。在該論文中，華盛頓大學的團隊開發了一種新的機率模型，旨在解決機器人的一些基本問題：透過觀察和模仿人類來學習新技能。

華盛頓大學的發展心理學家和電腦科學家之間的一項合作研究旨在幫助機器人以人類兒童的方式學習新事物。該團隊嘗試用嬰兒跟隨大人眼神的方式來教會機器人完成相同的任務。來源：University of Washington

機器人專家與華盛頓大學心理學教授、I-LABS聯合主任Andrew Meltzoff共同合作完成了這篇研究。Andrew Meltzoff的研究表明18個月大的嬰兒可以推測一個成年人的行為目標，並且採用自己的方法來達到這一目標。例如，嬰兒看到成年人試圖將槓鈴狀的玩具拉開，但是這個成年人失敗了，因為這個玩具粘的非常牢固，他的手從兩端滑下去，因此最終放棄了。嬰兒看得非常仔細，然後決定採用自己的方法來嘗試——他們用小手指將玩具抓住，然後用力猛拉，正是在模仿成年人的方式。兒童可以透過自我探索來學習閱讀技巧，這有助於他們學習物理規則，以及他們的行為將如何影響其他物體，最終他們將獲得足夠的知識，從而可以學習別人，並且理解別人的意圖。

Meltzoff認為嬰兒快速學習的一個原因是他們喜歡玩耍。「嬰兒玩耍的時候看起來是無意識的，但是這對於未來的學習非常有用。這就是嬰兒的創新秘訣。如果他們正努力想要與一個新玩具玩耍，那麼事實上他們正在使用和其他玩具玩耍時學到的知識。在玩耍的過程中他們正在學習一種意識模式，那就是他們的行為將如何改變這個世界。一旦你獲得了這樣的模式，你就可以開始解決一些新問題，並預測其他人的意圖。」Meltzoff說。 Rao的團隊基於這項關於嬰兒的研究開發了一種機器學習演算法，使得機器人可以探索自身行為對結果的影響。然後它可以使用這種機率模型來推測人類想要它完成的任務，並且完成這個任務，甚至還會在不確定時進行求助。該團隊在兩種不同的情景下測試了它的機器人模型：一個是計算機模擬實驗，在該實驗中機器人學習如何跟上人類的眼神；另一個實驗是機器人要模仿人類的行為，例如將玩具、食物等物品移動到桌面的不同區域。在眼神實驗中，機器人學會了其頭部運動的一個模式，並且假設人類的頭部運動方式是一樣的。當人類看著這個房間的時候，機器人可以追蹤人類頭部運動的開始點和結束點，從而推測人類正在看的位置。然後機器人會利用學到的頭部運動的模式來望向人類看的位置。

該團隊也重新設計了Meltzoff的一個測試，該測試表明具有視覺障礙和帶著眼罩的嬰兒對於帶著眼罩的成年人的行為並不感興趣，因為他們知道這個人其實看不見任何東西。一旦該團隊讓機器人意識到帶上眼罩究竟意味著什麼，它就不會再跟隨人類的頭部運動來尋找相同的地點。「嬰兒會透過自己的經驗來理解別人的行為，我們的機器人也是如此。」Meltzoff說。在第二個實驗中，該團隊允許機器人在桌面上移動物體。機器人透過這種模式來模仿人類移動物體的行為，或者將桌面的物體清理乾淨。除了模仿人類的行為以外，機器人有時候也會使用不同的方法來達到相同的目的。「如果人類將物體推到一個新的位置，對於機器人來說或許將物體拿起來放到另外一個地方更容易。但是這就需要知道目標是什麼，而這也是機器人領域非常困難的一個問題，也是該論文想要解決的一個問題。」華盛頓大學電腦科學與技術博士研究生Michael Jae-Yoon Chung說。透過學習如何辨認目標、如何模仿簡單行為的試驗，該團隊計劃進一步研究這樣的模式如何幫助機器人學習更加複雜的任務。「嬰兒透過自己的玩耍和觀察別人的方式來學習，他們是世界上最好的學習者。為什麼不讓機器人用嬰兒學習新知識的方式來學習呢？」Meltzoff說。

編譯：楊超。

相關文章