機器人大模型新公司!資料規模比同行大1000倍!貝索斯、孫正義等押注

机器之能發表於2024-07-12

機器之能報導

編輯:Sia

用 OpenAI 的方式顛覆機器人世界。

「GPT-3 時刻正在進入機器人世界。」

最近,Sequoia 合夥人 Stephanie Zhan 在投資了一家新機器人初創後說道。

無論是在物流、車廠試點的人形機器人,還是四足機器狗,都要有腦子。過去,腦子要定製,「專款專用」,現在,不必了。

最近,位於匹茲堡的機器人初創 Skild AI 聲稱,已經開發出一種通用的智慧系統。

它就像一個通用的智慧模組,可以接入不同機器人,讓他們立刻獲得一些基本能力,如爬坡、跨過障礙、識別和撿起物品。

7 月 9 日,Skild AI 正式宣佈籌集到 3 億美元 A 輪融資,公司估值達 15 億美元。投資人陣容也非常強大,涵蓋科技界、頂尖風投甚至學術機構。

貝索斯和孫正義的軟銀都出現在領投名單中,他們均以長期投資視野著稱。

Lightspeed(領投)、Coatue(領投)、Sequoia、Menlo Ventures、General Catalyst 等都是全球知名的頂級風投,也出現在投資名單中。

卡內基梅隆大學的參投也表明,Skild AI 技術得到學術界認可。


-1-

何方神聖?

Skild AI 由兩位前卡內基梅隆大學教授 Abhinav Gupta 和 Deepak Pathak 於 2023 年 5 月創立,長期目標是開發紮根於物理世界的通用人工智慧 ( AGI )。

圖片前卡內基梅隆大學教授 Deepak Pathak(左)和 Abhinav Gupta(右)創立了 Skild AI,他們也曾是 Meta 的 AI 研究人員。

圖片團隊成員來自 Meta、特斯拉、Nvidia、亞馬遜、谷歌以及卡內基梅隆大學、史丹佛大學、加州大學伯克利分校和 UIUC 等名校。

Lightspeed 合夥人 Raviraj Jain 也於 2023 年 7 月領導了該公司的種子輪融資。去年 4 月,他第一次看到 Skild AI 模型接受壓力測試,至今印象深刻。

接入基礎模型的機器人能在全新、未經專門設計的環境中執行任務——這可不是為了演示而特別準備的,是真實能力的展現。

看到機器人能爬樓梯時,他非常驚訝。爬樓梯是一個複雜的平衡問題,通常需要針對特定環境程式設計和訓練,但 Skild AI 的模型能讓機器人迅速學習和適應新環境,完成任務。

更讓他印象深刻的是,機器人展現出一種「湧現能力」,雖然很簡單(如撿起從手中滑落的東西或者旋轉某個物體),但沒人特意教過它們。我們曾在大型語言模型身上也觀察到了類似現象。


-2-

資料集

「規模空前」,比對手的大1000倍

模型泛化能力和湧現能力,離不開所謂「規模空前」的資料集:一個由文字、影像和影片組成的龐大資料集。

官方說法,比競爭對手使用的資料庫大 1000 倍。(不知道對手是否包括特斯拉?:))

圖片
他們的基礎模型在比其競爭對手大 1000 倍的資料集上進行訓練,可以接入各種機器人,幫助他們獲得如爬坡、識別和撿起物品等基礎能力。

「規模空前」歸功於他們結合了多種資料收集技術,既有一些常規操作,也有兩位創始人多年研究工作中開發的「獨門秘方」。

他們會讓人類遠端操作機器人,然後收集這些運算元據。另一個辦法是讓機器人執行隨機任務,試錯學習,並記錄這些豐富的資料資訊。

他們還利用大量公共影片訓練模型。這些方法的結合有助於 AI 系統獲得更強的適應性和理解力。

至於「獨門秘方」,一個是 Deepak Pathak 讀博時開發的一種向機器人灌輸「人工好奇心」的方法。

當機器人對自己行為的結果感到不確定時,它就會變得更「好奇」,願意探索更多場景,帶回更多資料,增加學習的廣度和深度。

Pathak 還設計了一種方法,可以將人類給 GPT 等大型語言模型下的命令(如開啟一罐牛奶),轉化為實際動作。

除了這些與物理世界互動和操作的真實資料,他們也結合了從模擬環境中收集的資料。雖然模擬資料不能完全替代真實資料,但它可以提供大量的補充學習材料,特別是在一些難以在現實中頻繁重複的場景中。

然而,這種綜合的手段也面臨挑戰,比如如何有效地整合來自不同源的資料。

2022 年,兩位創始人終於找到辦法,將從不同源資料中學習(如從影片、基於好奇心、真實世界學習)整合到一個連貫系統中,大大提高了模型的學習效率和適應能力。


-3-

OpenAI 式顛覆

顯然,Skild AI 也面臨著來自一系列機器人公司的激烈競爭。

特斯拉擎天柱正在快速進化,馬斯克透露年底會迎來有意思的更新。行業巨頭 OpenAI 最近恢復了其機器人團隊,為機器人公司提供基礎模型。

此外,還有由億萬富翁 CEO Brett Adcock 掌舵的人形機器人公司 Figure AI 和 OpenAI 衍生公司 Covariant,該公司正在為機器人構建 ChatGPT,並已籌集了超過 2 億美元。

Skild AI 也設想了一個類似 OpenAI 的未來:

透過微調,就可以在 Skild 基礎模型上構建不同的用例和產品。

這正是他們顛覆機器人行業的方式。

最終,他們希望抵達機器人 AGI,人們可以在物理世界中,與之互動。


參考連結
https://www.skild.ai/blogs/announcing-our-300m-series-a
https://www.forbes.com/sites/rashishrivastava/2024/07/09/this-15-billion-ai-company-is-building-a-general-purpose-brain-for-robots/


圖片

相關文章