機器之能報導
編輯:Sia
用 OpenAI 的方式顛覆機器人世界。
「GPT-3 時刻正在進入機器人世界。」
最近,Sequoia 合夥人 Stephanie Zhan 在投資了一家新機器人初創後說道。
無論是在物流、車廠試點的人形機器人,還是四足機器狗,都要有腦子。過去,腦子要定製,「專款專用」,現在,不必了。
最近,位於匹茲堡的機器人初創 Skild AI 聲稱,已經開發出一種通用的智慧系統。
它就像一個通用的智慧模組,可以接入不同機器人,讓他們立刻獲得一些基本能力,如爬坡、跨過障礙、識別和撿起物品。
7 月 9 日,Skild AI 正式宣佈籌集到 3 億美元 A 輪融資,公司估值達 15 億美元。投資人陣容也非常強大,涵蓋科技界、頂尖風投甚至學術機構。
貝索斯和孫正義的軟銀都出現在領投名單中,他們均以長期投資視野著稱。
Lightspeed(領投)、Coatue(領投)、Sequoia、Menlo Ventures、General Catalyst 等都是全球知名的頂級風投,也出現在投資名單中。
卡內基梅隆大學的參投也表明,Skild AI 技術得到學術界認可。
-1-
何方神聖?
Skild AI 由兩位前卡內基梅隆大學教授 Abhinav Gupta 和 Deepak Pathak 於 2023 年 5 月創立,長期目標是開發紮根於物理世界的通用人工智慧 ( AGI )。
前卡內基梅隆大學教授 Deepak Pathak(左)和 Abhinav Gupta(右)創立了 Skild AI,他們也曾是 Meta 的 AI 研究人員。
團隊成員來自 Meta、特斯拉、Nvidia、亞馬遜、谷歌以及卡內基梅隆大學、史丹佛大學、加州大學伯克利分校和 UIUC 等名校。
Lightspeed 合夥人 Raviraj Jain 也於 2023 年 7 月領導了該公司的種子輪融資。去年 4 月,他第一次看到 Skild AI 模型接受壓力測試,至今印象深刻。
接入基礎模型的機器人能在全新、未經專門設計的環境中執行任務——這可不是為了演示而特別準備的,是真實能力的展現。
看到機器人能爬樓梯時,他非常驚訝。爬樓梯是一個複雜的平衡問題,通常需要針對特定環境程式設計和訓練,但 Skild AI 的模型能讓機器人迅速學習和適應新環境,完成任務。
更讓他印象深刻的是,機器人展現出一種「湧現能力」,雖然很簡單(如撿起從手中滑落的東西或者旋轉某個物體),但沒人特意教過它們。我們曾在大型語言模型身上也觀察到了類似現象。
-2-
資料集
「規模空前」,比對手的大1000倍
模型泛化能力和湧現能力,離不開所謂「規模空前」的資料集:一個由文字、影像和影片組成的龐大資料集。
官方說法,比競爭對手使用的資料庫大 1000 倍。(不知道對手是否包括特斯拉?:))
他們的基礎模型在比其競爭對手大 1000 倍的資料集上進行訓練,可以接入各種機器人,幫助他們獲得如爬坡、識別和撿起物品等基礎能力。
「規模空前」歸功於他們結合了多種資料收集技術,既有一些常規操作,也有兩位創始人多年研究工作中開發的「獨門秘方」。
他們會讓人類遠端操作機器人,然後收集這些運算元據。另一個辦法是讓機器人執行隨機任務,試錯學習,並記錄這些豐富的資料資訊。
他們還利用大量公共影片訓練模型。這些方法的結合有助於 AI 系統獲得更強的適應性和理解力。
至於「獨門秘方」,一個是 Deepak Pathak 讀博時開發的一種向機器人灌輸「人工好奇心」的方法。
當機器人對自己行為的結果感到不確定時,它就會變得更「好奇」,願意探索更多場景,帶回更多資料,增加學習的廣度和深度。
Pathak 還設計了一種方法,可以將人類給 GPT 等大型語言模型下的命令(如開啟一罐牛奶),轉化為實際動作。
除了這些與物理世界互動和操作的真實資料,他們也結合了從模擬環境中收集的資料。雖然模擬資料不能完全替代真實資料,但它可以提供大量的補充學習材料,特別是在一些難以在現實中頻繁重複的場景中。
然而,這種綜合的手段也面臨挑戰,比如如何有效地整合來自不同源的資料。
2022 年,兩位創始人終於找到辦法,將從不同源資料中學習(如從影片、基於好奇心、真實世界學習)整合到一個連貫系統中,大大提高了模型的學習效率和適應能力。
-3-
OpenAI 式顛覆
顯然,Skild AI 也面臨著來自一系列機器人公司的激烈競爭。
特斯拉擎天柱正在快速進化,馬斯克透露年底會迎來有意思的更新。行業巨頭 OpenAI 最近恢復了其機器人團隊,為機器人公司提供基礎模型。
此外,還有由億萬富翁 CEO Brett Adcock 掌舵的人形機器人公司 Figure AI 和 OpenAI 衍生公司 Covariant,該公司正在為機器人構建 ChatGPT,並已籌集了超過 2 億美元。
Skild AI 也設想了一個類似 OpenAI 的未來:
透過微調,就可以在 Skild 基礎模型上構建不同的用例和產品。
這正是他們顛覆機器人行業的方式。
最終,他們希望抵達機器人 AGI,人們可以在物理世界中,與之互動。
參考連結
https://www.skild.ai/blogs/announcing-our-300m-series-a
https://www.forbes.com/sites/rashishrivastava/2024/07/09/this-15-billion-ai-company-is-building-a-general-purpose-brain-for-robots/