機器之能報導
編譯:吳昕
條條大路通羅馬(AGI),雖然方式不同,但我們可以期待非具身 AGI 和具身 AGI 大致同時出現。
作為一家炙手可熱的人形機器人賽道選手,1X 前陣子秀了一把 EVE 的新成果 。昨天,一直在 X 平臺比較活躍的 1X AI 副總裁 Eric Jang 寫了一篇文章,公開了其對AI 和機器人技術發展方向的一些預測。兩年前,谷歌高階研究科學家 Eric Jang 離開 Google Robotics,加入 1X Technologies(原名 Halodi Robotics)負責 AI 工作。從那時起,AI 領域發生了很多事情,他也一直在思考 AI 之路將通往何處。
“許多 AI 研究人員仍然認為通用機器人還需要幾十年的時間。但請記住,ChatGPT 的發生幾乎就在一夜之間。”他在昨天的文章中寫道,“我認為,這也將發生在機器人技術上。一旦發生這種情況,計算本身將徹底改變。” “最終,所有 AI 軟體都會融合起來,看起就像機器人軟體。”
1X 人工智慧副總裁 Eric Jang接受播客節目的採訪,討論AI和人形機器人技術的發展前景,包括為什麼現在是投資和建造通用機器人的最佳時機。
文章不算長。Eric Jang 首先談到 1X AI 團隊完成的兩項重要工作,這些成就讓他“非常自豪”。一個是透過端到端的神經網路,實現了人形機器人 EVE 的自主性。在這些影片中,EVE 掌握新技能都不用專業人士寫程式碼,而是直接從資料中學習。這意味著未來擴充套件機器人能力的門檻大為降低——不用再受僱用專業人士以及他們撰寫程式碼速度的限制。
隨著時間推移,機器人功能會越來越受資料驅動,同時對專業知識的依賴性越來越低,這種機器人技術將更容易被更多沒有技術背景的普通使用者所接受。
“據我所知,1X 是第一家讓資料收集系統自我培訓的機器人公司。” Eric Jang 提到第二個讓他驕傲的成績。EVE 機器人透過資料來理解世界,因此,如何收集和管理訓練資料比演算法模型重要得多。為此,他們將 Meta VR Quest 頭顯裝置變成了機器人的 AI 訓練資料採集系統,並投入大量資金和人力提升資料質量。比如,一些沒有機器學習背景的人也可以用自己收集的資料微調基礎模型,從而領悟如何收集更高質量的資料。
公司的運維團隊(無需專業的機器學習背景)自行教會機器人一些行為。
“這個辦法確實縮短了收穫良好模型的時間,因為收集資料的人可以非常快速地獲得反饋,瞭解他們的資料有多好以及實際需要多少資料來解決機器人任務。”Eric Jang 預測,“這將成為未來收集機器人資料的普遍正規化。”
公司的運維團隊(無需專業的機器學習背景)自行教會機器人的一些行為。
1X、Figure、特斯拉等公司的技術路子都是一樣的—— 建立完全通用的硬體、軟體,應對各種現實案例。當然缺點是從來沒有人解決過這個問題,但潛力無窮。這和當今大多數機器人公司提供價值的方式也完全不同。無論是叉車、割草機、掃地機還是焊接、噴塗或者拾取包裹的工業機械臂都是從一個很窄的領域開始,垂直整合硬體和軟體,從來沒有真正突破自己的利基市場走向通用領域。
現在,Eric Jang 和同事們正雄心勃勃地擴充套件模型,也發現機器人公司與 LLMs 公司所面臨挑戰有很多相似之處。他非常贊同一位同行的觀點,“所有 AI 軟體都將融合到機器人軟體中”。或者說,所有 AI 軟體最終都會融合起來,看起就像機器人軟體。
他談了一些觀察和論據。當和那些思考職業發展的 AI 研究人員和工程師聊天時,他發現機器人領域往往不是這些人才的首選。原因也不難猜,過去機器人業務的成績單乏善可陳,公司死亡率居高不下,未來也可能繼續如此。更何況,現在有一大把更容易拿到投資的選擇,比如聊天機器人、生成式 AI、顛覆搜尋、智慧助理、重新發明操作介面等等。
Eric 承認,在純軟體環境中部署機器學習更容易,因為位元(數字)世界是可預測的。機器人要和原子構成的物理世界打交道,所有外部資訊都是未知的。你不知道你在哪裡,其他東西在哪裡,如果你接觸到什麼會發生什麼(按下開關,燈是否亮?你甚至根本不知道是否按下了開關)。即使一些非常瑣碎的事情,比如區分坐電梯下降和乘龍門吊上升都很困難,因為在慣性測量單元( IMU )感測器的眼裡,這些力都很相似。區分不了的機器人最終會躺在地板上抽搐,因為它認為自己還有機會保持平衡。
但這種分別不應被過度強調。當 AI 軟體開始接觸現實世界時(比如用 LLMs 驅動的助手叫 Waymo),面臨的挑戰難度並不亞於機器人也很相似——應用程式與熵源互動時間越長,就更難保證程式行為正確性。“即使你沒有造一個物理意義上的機器人,但你的程式碼庫最終看起來就像一個現代機器人軟體棧。” Eric 寫道,還舉了一些例子。
比如,他本人花了相當一部分時間在這些 LLMs 也會熟悉的工作上——確保資料載入器、日誌管理平臺的可擴充套件性,上傳資料時確保可以將這些資料按 transformer 的時間因果序列排序。他還設計了一張表格,列舉了機器人和 LLMs 所面臨的類似挑戰。
這張表格列舉出了機器人和 LLMs 所面臨的類似技術挑戰
所有這些問題都很棘手,但並非不能解決。“儘管大多數 AI 公司和實驗室不必考慮執行器硬體、電磁干擾或快速移動軀體帶來的安全隱患,但機器人+研究過程中的工程技能,將是未來所有軟體非常不可或缺的一個方面,而不僅僅只有控制機器人才需要。” Eric 寫道。如果你接受這樣一個前提—— LLMs 和機器人面臨類似的工程和基礎設施挑戰,“那麼,我們也可以期待非具身 AGI 和具身 AGI 大致同時出現。硬體這部分已經準備好了——就在過去 10 年發表的研究論文中。”
“許多 AI 研究人員仍然認為,通用機器人還需要幾十年的時間。但請記住,ChatGPT 似乎是在一夜之間發生的。我認為,這也將發生在機器人技術上。一旦發生這種情況,計算本身將徹底改變。”
除了 AGI,Eric Jang 正在研究的主題之一還包括利潤——如何將 1000 萬美元 GPU 投入轉化為 1000 萬美元以上的利潤。過去兩年中籌集了千萬甚至上億美元、從頭開始訓練自己 LLMs 的初創公司都支付了巨大的成本,而現在基本上每個 AI 初創都能免費獲得一些資源。“我認為,絕大多數成功的創業公司都能靈活地駕馭開源的潮流。”
“當然,我並不是說大膽下注訓練 AGI 不是一個好主意;我只是認為,最適合這條路子是那些能將計算成本降到最低的公司。”否則的話,還是請嚴格遵守與能力相關的擴充套件定律和指標。“許多初創公司都在關注谷歌如何將在 Rankbrain 上投入的幾十億研發成本變成好幾倍的利潤,但他們也忘記了,這首先需要建立谷歌搜尋業務。”
除了 GPU 的昂貴,Eric 也感慨當下人才成本之瘋狂。“我曾與博士生交談過,他們要求 7 位數的薪水。”這個數字讓他想起六年前聽聞 Open AI 聯合創始人 John Schulman 薪水有 275k 時的感覺。
最後,Eric 預測 “ 這一代自動駕駛汽車公司將在未來幾個月出現很多變化。同時,沒有比現在更好的時機來創辦一家全新的自動駕駛公司了。”
參考連結
https://evjang.com/2024/03/03/all-roads-robots.html