機器人把握好手上的力道,安全地做家務有多難?1X人工智慧副總裁撰文詳解

机器之心發表於2024-09-02
要想造出一款真正擬人的機器人有多難?

通常機器人動起來,渾身的關節都會發出咔嗒聲,但被 OpenAI 看到的創業公司 1X 卻能做到不一樣的事情,他們上週公開的新款人形機器人 NEO 可以做到安靜且實用。如果我們把影片的音量調高,才能聽到它彎腰撿起揹包時電機發出的輕微嗡嗡聲。機器人把握好手上的力道,安全地做家務有多難?1X人工智慧副總裁撰文詳解
看完這個影片,真想問一句,這真不是個穿著皮套的人類嗎?

如今的工業機器人可以把動作做得很快,但它在與東西接觸之前,需要把速度減到極慢。為確保安全,這些機器人往往需要被關在安全籠中,而 NEO 卻能輕柔地摟住影片中的女生,自然流暢地把書包遞給她。這是如何做到的呢?
圖片
1X Technologies 的 AI 副總裁 Eric Jang 寫了一篇部落格,公開了 NEO 背後的技術。

圖片

他稱這篇部落格是一篇電機慣量和齒輪系統的教程。在加入 1X Technologies 之前,Eric Jang 曾在谷歌的機器人研究部門任職 6 年,但他坦言,直到加入 1X Technologies,他才深刻領悟到這些概念有多重要。

透過親自進行物理計算,Eric Jang 更加堅定地認為,輕質且具有高扭矩的電機是打造具有學習能力的通用機器人的關鍵。

噪音大是因為關節動能轉換效率低下?

設想有一個重量為 3 公斤、半徑為 0.4 米的輪子,它以每秒 5 弧度的速度旋轉。從輪子上延伸出一根槓桿,這根槓桿將與一個固定不動的木塊發生碰撞。假設這次碰撞完全是非彈性的,這意味著輪子在碰撞後將停止旋轉,不會木塊上反彈。為了簡化計算,我們假設槓桿臂沒有質量,僅用於阻止輪子的旋轉。
圖片
根據旋轉動能公式圖片,其中 I 是轉動慣量,ω 是角速度。因為假設槓桿沒有質量,系統的慣性相當於一個固定的圓柱體:圖片。代入數值可以算出 I = 0.24 kg⋅m^2。因此,可以進一步算出這個系統的旋轉動能為 3 焦耳。

在現實環境的非彈性碰撞中,輪子和木塊的總動量守恆,而它們的總動能則不會。因此,系統的旋轉動能將小於 3 焦耳。

能量是一個守恆量,那麼其餘的動能去哪了呢?

答案是,部分動能轉化為了運動,剩餘的動能則以熱能、聲音和內部材料變形的形式消耗掉了。當你聽到機器人在移動時發出巨響,那是因為動能的傳動效率低下,將機械功轉化為了聲音,能量被浪費了。

由於木塊阻止了槓桿的移動,導致輪子的新速度降為零,相應的動能也降至零。這意味著要使輪子停止旋轉,必須將全部的動能轉化為其他形式的能量。幸運的是,3 焦耳並不是很大的能量,這相當於一隻小狗以 1 米 / 秒的速度小跑著撞向你並停下來。

加入齒輪箱後的碰撞

把上面的系統稍作修改:現在我們有兩個輪子,每個輪子的質量為 1.5 千克,半徑為 0.4 米。這兩個輪子分別以 5 弧度 / 秒和 50 弧度 / 秒(即第一個輪子速度的 10 倍)的速度旋轉,並與一個固定的木塊發生碰撞。第二個輪子的旋轉速度是第一個輪子的 10 倍,透過齒輪裝置驅動第一個輪子。這種設定相當於一個 10:1 的齒輪減速比,它降低了槓桿的最終速度。

系統的動能是兩個輪子旋轉動能的總和。和上一個例子一樣,系統在碰撞後會靜止,所有動能必須以熱量、噪音和材料變形等形式耗散。
圖片
雖然槓桿接觸木塊的速度與之前相同,但總動能(150 焦耳)卻是原來單輪系統的 50 倍!如果按機器人齒輪箱的標準,將齒輪比增加到 100,那麼需要耗散的總動能將達到 15000 焦耳。

這大致相當於一個棒球以每小時 1000 英里的速度與你相撞。在這種速度下,槓桿碰撞到的任何物體,都會被徹底摧毀。當然,齒輪系統本身也將無法倖免。

這可能有點反直覺,因為齒輪連動裝置往往是出於安全設計的。如果槓桿的最終速度保持不變,輪子的總質量也不變,也不設定木塊阻止槓桿的運動,把兩組裝置的運動分別錄下來觀察,那麼光看影片,看不出區別。但是,一旦涉及到碰撞 —— 尤其是那些意料之外的碰撞 —— 情況就會大不相同。

旋轉電機的物理原理,對於人形機器人安全地與世界發生接觸至關重要。大多數人形機器人公司選擇將機器人部署在工廠而不是家庭中,是因為它們依賴於僵硬的高速齒輪傳動系統。

正如前文中那個棒球「毀天滅地」的動能,這種系統在人身邊並不安全,因此,需要用防護籠把他們圍起來。
圖片
關在防護籠裡的機器人

試想,如果想讓機器人快速地端來一杯咖啡,那麼需要它肢體的末端執行器快速移動,這意味著在機器人的肢體和齒輪的另一側,必須有一個轉速遠遠超過末端執行器的電機在運轉。由於動能與角速度的平方成正比,機器人的動作實際是在由高速旋轉的齒輪的慣性控制著,而非機器人的肢體鏈路本身。MIT 的 Russ Tedrake 教授在他的課上,對這些違反直覺的機器人動力學現象進行了精彩的闡釋。

圖片

課程連結:https://manipulation.csail.mit.edu/robot.html

那麼,既然齒輪箱又耗能又不安全,為何還要使用它們呢?

原因在於齒輪箱發揮了關鍵的機械槓桿作用:許多電機在單獨工作時無法提供足夠的扭矩,所以工程師們會在高速電機上安裝齒輪,犧牲速度來換取必需的扭矩。

這種齒輪系統是「剛性」的,不能「反向驅動」,一旦齒輪開始轉動,它們就會緊緊地咬合在一起,很難再往回轉。因此在齒輪箱的另一端,需要施加更大的力量來抵抗高速電機產生的旋轉力。

基於以上考慮,1X Technologies 在的過去十年中一直致力於製造高扭矩、低轉速電機,最大限度地提升傳動系統的安全性。得益於 NEO 機器人採用的齒輪比較小、重量較輕的電機和驅動系統,它成為了首款真正意義上能夠安全融入家庭環境的家用機器人。

重新定義真人影片對於機器人訓練的意義

除了從機器人處收集的資料,研究者們也可以採用真人執行任務的第一人稱視角影片來訓練機器人,思路是這樣的:

1. 資料是通用機器人進步的「瓶頸」。機器人硬體價格昂貴,聘請人類遠端操作員使用笨重的硬體執行任務,費用也同樣不菲。而且遠端操作的效率很低,遠遠低於人類直接完成任務的速度。

2. 如果我們將頭戴式攝像機綁在人們身上,讓他們戴上能遮住肉體的大號橡膠手套,這樣很快就能收集到人們從事各種家務和任務的大量資料集。普通人每天在日常生活中,都會不自覺地完成大量不同的動作和操作任務。雖然直接感知原始運動輸出存在難度,但我們可以透過分析影片中的姿勢變化來推斷動作。在更先進的硬體出現之前,這種資料收集方式有助於打破通用機器人發展的障礙。

3. 網際網路上有許多第一人稱和第三人稱的影片,可以訓練機器人識別和學習人們在影片中進行的各種活動,從而進一步擴大我們的資料規模。

在擴大這類資料收集規模之前,還需要注意一點,我們體內沒有快速旋轉的部件,與轉速為 5000 RPM 的電機相比,肌肉的動能非常低,我們在移動時所攜帶的有效質量也要小得多,因此會發現雖然機器人的關節角度可能與人類大致相同,但它的旋轉電機提供的有效質量可能過大,無法靈巧地完成任務。

即使我們開發出了高效的動作控制策略,機器人在執行如輕鬆開關電燈或優雅奔跑等動作時,仍然無法達到人類的速度和流暢度。這是因為機器人在接觸物體時所施加的力與人類存在顯著差異。

那麼想要把人類的影片快速轉化成為機器人的運動策略,還需要以下的方法:

1. 一款像 NEO 非常順從和靈活的機器人

2. 讓機器人以慢於 1 倍的速度跟蹤影片的運動軌跡,而非直接複製「 人類硬體」的動態。不過這隻適用於靜態操作任務,對於在廚房裡摺疊衣服和準備食物等需要接觸很多物體的任務來說,不太適用。

3. 將運動規劃動態規劃解耦,讓運動規劃專注於達到目標位置,而動態規劃則集中於控制發生碰撞時的力。

相關文章