讓AI進入物理世界,首屆中國具身智慧大會展望智慧新紀元
机器之心發表於2024-04-06
前不久,圖靈獎得主Yann Lecun在Lex Fridman的播客中講道:機器人行業的興起已經等待了 10、20 年,而這個行業的發展要寄希望於AI的進步。
AI 發展可謂是瞬息萬變。科技巨頭們不是搶佔時機,比誰先發布,就是猛攻質量,比效能優劣。2022 年還被稱為 AIGC 元年,而 2024 年,就已經來到了具身智慧元年。何為具身智慧?先不談定義,看看下面這些展示,你有屬於自己的理解嗎?具身智慧其實是基於物理身體進行感知和行動的智慧系統,其透過智慧體與環境的互動獲取資訊、理解問題、做出決策並實現行動,從而產生智慧行為和適應性。以上展示來自 3 月 30-31 日上海徐匯西岸舉辦的首屆中國具身智慧大會(China Embodied AI Conference,CEAI)場外。作為人工智慧與人形機器人兩大前沿技術的結合,具身智慧產業是新質生產力的重要組成部分。在這場大會上可以看到具身智慧的最新發展方向,也給產、學、研三方帶來共同討論的機會。9 場主旨演講報告和 14 個專題論壇生動講述了具身智慧的定義、重要性以及發展態勢,讓參會者能夠切身感受到具身智慧就在身邊,並正在興起。中國工程院院士、中國具身智慧大會大會主席蔣昌俊表示,以 OpenAI 為代表的企業透過生成式無監督預訓練,利用大量網際網路文字和影像資料,構建瞭如 ChatGPT 和 GPT-4 這樣的大語言模型。這些模型首次展示了 AI 解決多種任務的能力,跨越了領域限制,讓我們窺見了實現通用人工智慧的潛力。雖然像 ChatGPT 這樣的大模型已展現出處理多模態資料和滿足人類需求的互動能力,但這種互動仍然侷限於數字世界。要實現真正的通用人工智慧,我們需要賦予它們在真實物理世界中的互動能力。這就意味著 AI 需要擁有實體,讓它們像人類一樣具備感知、思考和行動的能力。
由此可見,具身智慧不僅是機器學習、自然語言處理、計算機視覺等技術的整合應用,它還能將物理世界透過感測器對映到數字世界中,並以此來連結二者,讓 AI 真的能夠在物理世界中有所作為。大模型強大的通用能力已經顯現:上下文對話、生成創作、程式碼、邏輯推理、計算等多個方面都能夠輕鬆拿捏。但是如何將這樣的能力擴充到更多應用上呢?在本次大會的大模型與具身智慧專題論壇中,上海人工智慧實驗室雙聘領軍科學家代季峰表示,首先要將研究目標設定為多模態通用模型,這樣才能為大語言模型裝上手腳和眼睛,與現實世界互動。你對機器人應用的瞭解還停留在哪裡?是會做家務的史丹佛機器人,還是已經能進廠打工的 Atlas。這些和我們生活密切相關的機器人似乎更能吸引注意,但是在你注意不到的地方,機器人還發揮著你想象不到的功能。例如在遙遠的太空中,機器人仍然有著它們的大放異彩的時候。面對極端環境條件,複雜任務,機器人幫助人類做了很多做不了的事情。在農業方面,機器人能夠幫助人類施肥、灑藥、收割;製造的逆過程,如動力電池拆解也是具身智慧一個巨大的產業場景;建築行業的搬運與基本工作它們也能夠發揮作用。這就要求,它們既需要有解決任務的聰明「頭腦」,還有能夠精準操作的「身體」。正如英國皇家工程院院士、南方科技大學機器人研究院院長戴建生所說,智慧要實現和物理世界的聯合,就需要具身的這個「身」。除了應用場景的侷限,你對機器人形態的想象是不是也有些侷限。除了不同用途的機器人形態不同,你有沒有想過同一個機器人也能像變形金剛一樣變化不同的形態。在大會主旨演講報告中,戴建生向參會者介紹了「變胞機器人」。在現場,他放出一張《變形金剛》劇照,講述了機器人與汽車結構互換帶來的思考:我們的機器人能不能在不同的情況下進行形態上的轉變?身體形態會影響虛擬生物在複雜環境的適應學習能力,而相應的,複雜環境也對促進虛擬生物在形態和智慧上的進化。進化機器人的發展共有四個階段:進化機構、智變機構、機構變異、變胞機構。而變胞機器人開創了具身智慧的「環境適應身體」:根據環境自主改變結構,調整模態,實時進化。這樣的變胞機理可以實現一機多能的目標。不過,它還有非常重要的前提,如多感測器資訊融合、導航與定位、路徑規劃、機器人視覺等。其中,在視覺和聽覺都比較發達的機器人感知系統之外,觸覺也是一個新興的感測方面的賦能節點,這意味著感測器的發展有著新的方向。畢竟,在精細工作中,準確的力度、角度、姿勢都將決定任務的成敗。具身智慧產業在快速發展的同時,在成果轉化、應用場景、商業模式等方面還有待完善。針對業界廣泛關注的共性問題,本次大會邀請了全球具身智慧領域的頂尖專家分享行業最前沿的智慧和經驗。與會專家圍繞具身智慧的前沿科學問題、應用場景、競爭格局、發展前景等展開熱議。智慧時代,未來已來,一幅軟體和硬體雙向奔赴、相互賦能的生動圖景正在徐徐拉開。