一年秀一次!稚暉君的人形機器人上新了,還有開源、免費彩蛋

机器之心發表於2024-08-18
一年一秀,稚暉君的第二代人形機器人來了。

靈巧小手,正在麻將桌上叱吒風雲:

一年秀一次!稚暉君的人形機器人上新了,還有開源、免費彩蛋

不對不對,讓我們先看看整體氣質:

一年秀一次!稚暉君的人形機器人上新了,還有開源、免費彩蛋

然後是常規家務,能看出來也是非常熟練:

圖片

圖片

圖片

圖片

在大模型風靡的 2024 年,如果說 AI 領域什麼最火,「具身智慧」這個方向必定位列其中。

視線放到國內,「智元機器人」這傢俱身智慧公司備受矚目。自 2023 年 2 月成立以來,「智元機器人」已馬不停蹄地完成了 6 輪融資,迅速成為機器人創業圈的「頂流專案」。

創業半年,稚暉君和團隊就拿出了首款產品「遠征 A1」。一出道,「遠征 A1」的行走能力和人機互動就是業界領先水平。不過,在「遠征 A1」初次亮相之後,我們似乎再也沒聽說過它的下一步訊息,甚至沒有放出任何整活影片。

但今天的釋出會之後,我們知道了,智元機器人在「悶聲幹大事」。
圖片
在這場釋出會中,稚暉君一口氣推出了三款遠征系列機器人產品:互動服務機器人「遠征 A2」、柔性智造機器人「遠征 A2-W」、過載特種機器人「遠征 A2-Max」。最後的 One more thing 環節,智元 X-Lab 孵化的模組化機器人系列產品「靈犀 X1」和「靈犀 X1-W」也作為「彩蛋」正式亮相。

相比上一代,五款機器人採用了家族化設計語言,對機器人的外形進行了系列化的規整,結合輪式與足式兩種形態,覆蓋互動服務、柔性智造、特種作業、科研教育和資料採集等應用場景。

關於量產進度,智元機器人也透露了最新訊息:2024 年預估發貨量將達到 300 臺左右,其中雙足 200 臺左右,輪式 100 臺左右。

新一代遠征 A2

從「遠征 A1」開始,智元在機器人產品上的落地方向就已經很清晰:「進廠打工」。今年的「遠征 A2」更是為批次「進廠打工」做了更充分的準備。

我們來看下這個家族的成員:
圖片
「遠征 A2」是一款互動服務機器人,全身具備超過 40 個主動自由度的關節和仿人的靈巧雙手,能夠模擬出豐富和複雜的人類工作。它擁有一個可以持續學習的大腦,由大語言模型加持。此外,它還具備多模態的感知,輸入系統,可以透過視覺感知互動者的情緒。

「遠征 A2-Max」是一款過載特種機器人,既力大無窮又具備靈巧作業的優勢,在開場的情景劇中,它輕鬆地搬動了 40kg 的航空箱,目前「遠征 A2-Max」還處於產品研發階段。

「遠征 A2-W」是一款柔性智造機器人,它的兩條手臂既可以獨立操作,也可以協同工作。它採用了輪式底盤,結合機身搭載的 rgbd 鐳射雷達、全景相機、為全域安全配置的感測器等等構件,使得它可以在各種環境中快速而平穩的移動。

在釋出會前,「遠征 A2-W」的表現簡直像鋼鐵俠的「賈維斯」走進了現實。在聽懂稚暉君的指令後,它完全自主地開啟了可樂瓶子,在榨汁機中放入葡萄,按下榨汁機,一滴沒撒地把榨汁機裡的飲料倒進了杯子,給稚暉君端上了一杯「萄氣可樂」。

除了顏值提升,「遠征 A2」系列機器人更是內外兼修。對於機器人的核心零部件,「智元機器人」創新地將機器人系統劃分為動力域、感知域、通訊域、控制域。顯然,「智元機器人」都是衝著全棧生態去的。
圖片
在動力域方面,「智元機器人」對 PowerFlow 關節模組實現了量產化迭代升級,從引數上看,PowerFlow 關節模組都有大幅提升。在穩定性和可靠性方面,「智元機器人」也對其峰值效能、老化速度等方面進行了大量測試和最佳化。
圖片
對於「幹活」而言對重要的靈巧手,這回「智元機器人」也升級了一番:自由度數躍升至 19 個,主動自由度翻倍至 12 個,在感知能力方面也引入了更多模態,例如基於 MEMS 原理的觸覺感知和視觸覺感知技術。
圖片
此外,「智元機器人」還推出了高精度力控 7 自由度雙臂,能夠精準執行阻抗控制、導納控制、力位混控等多種力控任務,也支援雙臂拖拽示教模式和視覺化調節。
圖片
對於感知域方面,新一代的遠征機器人系列整合了 RGBD 相機、鐳射雷達、全景相機等感測器,引入自動駕駛 Occupancy 前沿感知方案,透過 SLAM 演算法進一步提升環境理解能力。

圖片

在通訊域方面,「智元機器人」自研了具身原生、輕量化、高效能的智慧機器人通訊框架 AimRT。相比 ROS 等第三方中介軟體,提升了效能、穩定性、系統部署的效率和靈活性,同時又完全相容 ROS/ROS2 已有生態。AimRT 將於 9 月底開源。
圖片
對於控制域方面,「智元機器人」結合了 Model-based 與 Learning-based 兩種演算法,進一步提升機器人運動控制與適應能力。對於 Model-based,「智元機器人」進一步提升了系統的魯棒性,因此,在釋出會上機器人所做的演示才能如此流暢和絲滑。對於 Learning-based 演算法,「智元機器人」在這裡劃了一個重點,希望能促成機器人訓練方法從演算法驅動 - 資料驅動的轉變。
圖片
在運控演算法的基礎上,「智元機器人」預研了基於自然語言指令集驅動的、可以適配不同機器人本體的 AgentOS,基於強化學習,實現機器人技能的精準編排與高效執行。
圖片
首次提出 G1-G5 具身智慧技術演進路線

在本次釋出會上,智元機器人還首次提出了具身智慧領域的技術演進路線,包含從 G1 到 G5 五個階段:
圖片
G1 指的是基礎自動化階段,也就是基於手工設計的特徵,配合簡單的機器視覺去做一些反饋。這一階段的部署是為特定的場景量身定製的,雖然可以解決某些場景下的任務執行問題,但無法在不同的場景裡面做低成本快速遷移。

G2 是「通用原子技能」階段,針對大量不同的場景任務和各種作業的任務需求,提煉出一些可以複用的原子能力。簡而言之,是以相對通用的方式去實現類似場景任務的快速遷移,然後配合大語言模型框架去做任務編排,使得機器人具備一定的泛化能力。

G3 則意味著具身智慧的整體架構開始調整為「端到端」的路線,儘管這個階段與 G2 階段的演算法架構可能是類似的,但此時的各項「原子能力」的形成方式,已經由手工設計的演算法驅動變為了大量資料採集之後的資料驅動。

區別於前三個階段,G4 階段將會出現一個通用的端到端操作大模型。到了這一階段,即可引入大量跨場景的真實資料和模擬資料,同時引入世界模型幫助 AI 理解現實世界背後的物理原理,理解不同任務背後底層邏輯的相通之處。比如對於「擰開瓶子」和「擰開門把手」這兩件事,就不再需要採集兩份單獨的資料以獲得兩項單獨的技能。最終通向無限趨近 AGI 的 G5 階段。

過去一年,智元機器人已經在 G2 路線取得了階段性突破,實現了通用的位姿估計模型 UniPose、通用的抓取模型 UniGrasp,通用的力控插拔模型 UniPlug 等一系列 zero-shot 和 few-shot 的通用原子技能。在 G2 階段的原子能力模型,面向柔性智造和互動服務場景,已經在多個實際場景中得到了商業應用。

在 G3 路線上,智元機器人也形成了一套完整的全流程具身資料方案 AIDEA(Agibot Integrated Data-system for Embodied AI,智元具身智慧資料系統)。
圖片
但我們都知道,要想形成這樣一套方案,首先需要投入大量的資料採整合本,不是每個機器人團隊都有條件做到的。

而智元機器人做到了,還預備在今年第四季度開源。

稚暉君表示,資料採集是整個環節的痛點。在過去一年中他們面向資料做了大量的基建工作,而且形成了一套完整、全流程的資料採集、應用的方案 AIDEA。

AIDEA 除了提供硬體本體方案之外,也會提供整個雲全鏈路資料平臺,還有 AIDEA ML 機器學習平臺進行模型訓練與演算法評測,以及 AIDEA Sim 模擬平臺。
圖片
稚暉君表示,他預計接下來智元會有百臺以上自由部署機器人專門用來做端到端的資料採集,他們也將於四季度開源基於 AIDEA 的百萬條真機、千萬條模擬資料集,以積極建設開放生態。

稚暉君的 One more thing

大概因為覺得一年才開一次釋出會屬實「鴿」太久了,稚暉君也在釋出會最後公佈了 One more thing:全棧開源機器人靈犀 X1、專業數採機器人靈犀 X1-W 兩款新品。

圖片

這兩款機器人來自於 X-Lab(稚暉君實驗室),是 10 個人不到 3 個月的時間做出的產品,裡面有非常多的創新細節。例如,自研了 PF86 和 PF52 兩款全新的 PowerFlow 關節,融入了模組化設計理念,可以透過簡單抱箍形式輕鬆拆裝。

基於 X-Lab 對極致創新的追求,稚暉君表示,會開源靈犀 X1 的本體設計圖紙、軟體框架、中介軟體原始碼、基礎運控演算法。

此外在執行器方面,X-Lab 自研了帶前饋力控、超低成本的自適應通用夾爪,也推出了滿足場景需求的百元級成本的六維力感測器。

對了,靈犀的售價是零元,開源大部分設計資料及程式碼,但賣零件。

稚暉君表示,希望這能夠推動「人形機器人人人造」時代的到來。

你喜歡嗎?

相關文章