AIxiv專欄是機器之心釋出學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報導了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯絡報導。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
論文連結: https://arxiv.org/pdf/2411.18623
論文標題:Lift3D Foundation Policy: Lifting 2D Large-Scale Pretrained Models for Robust 3D Robotic Manipulation
專案主頁: https://lift3d-web.github.io/
程式碼連結: https://github.com/PKU-HMI-Lab/LIFT3D
我們提出了 Lift3D,透過系統地改進隱式和顯式的 3D 機器人表示,將 2D 大規模預訓練模型提升為魯棒的 3D 操縱策略模型。
對於隱式 3D 機器人表示,我們設計了一種任務感知 MAE(Mask Autoencoder)自監督方法,它對任務相關的可操作區域進行掩蔽,並重建深度幾何資訊,從而增強 2D 基礎模型的 3D 空間認知。
對於顯式 3D 機器人表示,我們提出了一種 2D 基礎模型 lifting 策略,利用 2D 基礎模型的預訓練位置編碼(PE)來編碼 3D 點雲資料,用於 3D 操縱模仿學習。