Figure AI把「終結者」造出來了

机器之心發表於2024-08-06

能語音對話,VLM 視覺,每天工作 20 小時。


總會有這一天,但我們沒想到來的居然這麼快。

北京時間 8 月 6 日晚,矽谷著名具身智慧創業公司 Figure 正式釋出了自己的新一代人形機器人 Figure 02。

圖片

圖片

除了樣子夠科幻,這種機器人也有著足夠通用的智慧,它可以與人類實時對話,自動學習如何裝配零件。事實上,Figure 02 正在寶馬位於 Spartanburg 的工廠實習工作,我們彷彿已經進入了未來。

圖片

Figure 工程和設計團隊完成了對 Figure 02 硬體和軟體的徹底重新設計。在人工智慧、視覺、電池、電子裝置、感測器和執行器等關鍵技術上均取得了重大進步。Figure AI把「終結者」造出來了
具體來說,Figure 02 主要包括以下特點:

  • 實時語音對話:Figure 02 能夠透過連線到定製 OpenAI 大模型的內建麥克風和揚聲器與人對話;
  • 攝像頭:由 6 個 RGB 攝像頭驅動的 AI 視覺系統;
  • 機械手:具有 16 個自由度和與人類同等力量的第四代機械手;
  • 內建 VLM:支援機器人攝像頭進行快速常識性視覺推理
  • 大容量電池:機器人軀幹中的 2.25 KWh 定製電池組可提供 50% 以上的電量;
  • CPU/GPU:與上一代相比,機載計算和 AI 推理能力提高了 3 倍。

全面改進:通用 + 人形 + 實用化

這回升級,最大的變化可能是 Figure 02 真的準備好回應語音指令了。

去年那支驚豔科技圈 demo 裡,站在 Figure 01 前的人類向這位機器人提問:「可以拿點東西給我吃嗎?」它不僅識別出面前的物體是蘋果,它更懂得蘋果可以直接食用,於是它把蘋果遞給了面前的人,說道:「當然,拿去吃吧。」

今年 3 月,OpenAI 宣佈與 Figure 合作開發具身智慧,讓人形機器人擁有了實時有效的對話能力。背靠 OpenAI,Figure 能夠快速迭代機器人語音到語音的能力。Figure 表示,由於 Figure 02 的端側算力大幅提升,已經可以完全自主地在現實世界中執行各種任務。

在 Figure 02 上,機器人語音推理的實現主要得益於內建的麥克風和揚聲器連線到與 OpenAI 合作訓練的定製 AI 模型上。

圖片

Figure 02 的導航系統使用了 VLM(視覺語言模型),這使得機器人上的攝像頭能夠進行語義基礎研究和快速常識性視覺推理。VLM 是當前眾多造車新勢力正在研究的智慧駕駛新方向,在機器人領域,這種方法顯然也可以在很多工上實現突破性的效果。

圖片

續航能力可以說是人形機器人實用化面臨的最大挑戰之一。Figure 02 機器人軀幹內定製有容量為 2.25 KWh 的電池組,可以比 Figure 01 多提供 50% 以上的能量,從而最大程度地延長機器人的執行時間。Figure AI 的創始人、CEO Brett Adcock 表示,他們希望 Figure 02 每天能夠實現約 20 小時以上的有效工作。

圖片

我們可以看到,Figure 02 的外觀變得更加具有整體性,這是因為它採用了全新的外骨骼結構。相比於 Figure 01,機器人的外形設計轉變較為徹底。另外它也採用了整合佈線的設計。整合佈線具有以下好處:

  • 可靠性更高
  • 隱藏電線
  • 更緊密的封裝

圖片

從 Figure 01 到 Figure 02,外形上有很大改觀。

除了更好的佈線,Figure 02 還設計了定製的電線端子和聯結器,以提高機器人的可靠性。

圖片

為了能像人類一樣理解世界,Figure 02 透過多攝像頭 + AI 驅動的視覺系統來進行感知與推理。其在頭部、前軀幹和後軀幹共有 6 個板載 RGB 攝像頭,使得機器人具有超越人類的視覺能力。

圖片

最後還有靈巧的手指。Figure 02 搭載了第四代機械手,有 16 個自由度,並具有與人類相當的力量,可以勝任各種複雜任務,整個手包含了機械、電氣、控制和感測器等技術。

圖片

Brett Adcock 表示,隨著機器人的不斷執行,AI 資料引擎將收集並整理資料用於訓練模型,不斷提升效能。

圖片

看到 Figure 02 這麼精彩的亮相,讓人不禁想起了馬斯克家的擎天柱,兩者相比,不知道誰更勝一籌。

圖片

還有網友表示「Figure 02 預示著一個新時代的開始,這是目前世界上最先進的機器人,未來已來。」
圖片
創業公司 Figure:半個矽谷都在投

Figure 由 Brett Adcock 於 2022 年創立,是一家總部位於美國的機器人公司,專門開發人形機器人。該公司的目標是開發通用人形機器人,為人類帶來積極影響,為後代創造更美好的生活。

在生成式 AI 技術爆發後,很多以具身智慧為目標的機器人公司不斷出現,而 Figure 在其中顯得尤為亮眼。2023 年 3 月,Figure 走出隱身模式,推出了原型機器人 Figure 01,其外觀和動作都與人類相似。這是一款專為體力勞動設計的雙足機器人,最初針對的是物流和倉儲行業。

2023 年 5 月,該公司從 Parkway Venture Capital 領投的投資者手中籌集了 7000 萬美元。

同年 10 月,Figure 放出 Figure 01 雙足機器人行走影片。

圖片

很快到了今年 1 月,Figure 01 已經學會了煮咖啡。

圖片

2024 年 1 月 18 日,Figure 宣佈與寶馬合作,在汽車製造工廠部署人形機器人。此時的 Figure 01 號稱已經可以自主完成現實世界中的任務了。

圖片

Figure 01 在寶馬工廠裡工作。

今年 3 月,Figure 宣佈完成驚人的 6.75 億美元 B 輪融資,公司估值達到 26 億美元。投資者包括微軟、英特爾、OpenAI Startup Fund、Amazon Industrial Innovation Fund 、英偉達、貝索斯、「木頭姐」的方舟投資、Parkway Venture Capital、Align Ventures 等。

與此同時,Figure 還宣佈與 OpenAI 建立合作伙伴關係,包括 OpenAI 為 Figure 的人形機器人構建專門的 AI 模型,使其機器人能夠處理和推理語言。

3 月 13 日,藉助 OpenAI 技術,Figure 01 可以與人類進行全面對話。Figure AI把「終結者」造出來了
從直立行走,完成複雜任務到與人自然互動。這些技術亮點也是 Figure 和一直希望迴歸機器人領域的 OpenAI 達成合作協議的重要原因之一 —— 將 OpenAI 的研究與 Figure 的機器人經驗結合起來,為人形機器人開發下一代 AI 模型。

在今天 Figure 02 釋出後,高度整合的硬體與 VLM 等新一代 AI 技術結合,讓我們距離真正具有通用能力的人形機器人更近了一步。

很快,物理世界也要迎來 AI 帶來的變革了?

參考內容:
https://x.com/Figure_robot/status/1820791819023909031
https://www.youtube.com/watch?v=0SRVJaOg9Co
https://www.therobotreport.com/figure-02-humanoid-robot-is-ready-to-get-to-work/

相關文章