首次!大模型自動搜尋人工生命,做出AI科學家的Sakana AI又放大招 机器之心 發表於2024-12-25
2024 臨近尾聲,AI 又給了所有人一個大驚喜,這次可以用來自動發現新的人工生命形式了。 今年 8 月,Transformer 論文作者之一的 Llion Jones 與前谷歌研究人員 David Ha 共同創立的人工智慧公司 Sakana AI 造出了「世界上第一個用於自動化科學研究和開放式發現的 AI 系統」。他們稱之為 AI Scientist,即人工智慧科學家,詳情可參閱報導《首個全自動科學發現 AI 系統,Transformer 作者創業公司 Sakana AI 推出 AI Scientist 》。 而現在,他們又拿出了另一項震撼性的重磅研究成果:使用基礎模型搜尋人工生命的系統 ASAL。 人工生命(Artificial Life),聽起來很科幻,但其定義並不複雜:就是被製造出來的生命。數學家約翰・何頓・康威在 1970 年提出的著名的「生命遊戲」便是一種模擬人工生命系統,其中定義的規則可讓其中的「細胞」像生命體一樣運作。 研究人工生命的一個核心哲學理念是我們不僅想要了解「我們所知的生命」,還想要探索「可能存在的生命」。下圖為 ASAL 其中一位作者 Phillip Isola 的推文以及他分享的一種人工生命。 此外,人工生命研究還可以得到有望改變和加速 AI 進步的關鍵見解。該團隊表示:「透過利用 AI 加速人工生命的發現,我們可以加速對湧現、進化和智慧的理解 —— 這些核心原則可以啟發下一代 AI 系統!」 知名博主 Aran Komatsuzaki 表示,這是視覺語言模型在人工生命中的首次應用,可以跨基質發現多樣性、全新的模擬生命。 目前,人工生命研究主要是透過計算模擬進行,而這種方法必然意味著搜尋並描繪出整個可能的模擬空間,而不是研究任何單個模擬。這樣一來,研究者便可以瞭解不同的模擬配置可以怎樣產生不同的湧現行為。Sakana AI 的這篇論文首次實現了藉助基礎模型來自動化這個搜尋過程。另外,OpenAI、MIT等其他機構和獨立研究者也參與了研究。 論文標題:Automating the Search for Artificial Life with Foundation Models 論文地址:https://arxiv.org/pdf/2412.17799 線上論文:https://pub.sakana.ai/asal/ 專案程式碼:https://github.com/SakanaAI/asal/ 雖然人工生命模擬的進化和學習的具體機制有很多,但迄今為止,該領域取得實質性進展的一個主要障礙是:缺乏一種系統的方法來搜尋所有可能的模擬配置。如果沒有這種方法,在設計人工世界最重要的方面(世界本身的規則)時,研究者就必須依靠直覺。 對此,一部分挑戰在於簡單元件的大規模相互作用可能會產生複雜的湧現現象,這些現象很難甚至不可能被提前預測。 正是由於模擬配置與湧現現象之間缺乏關聯,因此研究者很難憑直覺設計出能展現出自我複製、類似生態系統的動態或具有開放屬性的模擬。因此,這一領域的實際做法往往是針對簡單和預期的結果來設計模擬,這就限制了意外發現的可能性。 也許,是時候自動化了!這樣,研究者就無需將注意力放在設定正確的規則和互動上,而可以關注更加高層面的問題,比如如何最好地描述我們最終希望湧現的現象,然後讓搜尋該現象的過程自動完成即可。 不過,描述目標現象本身就極具挑戰性。雖然之前已經有一些研究試圖透過複雜的度量(比如生命、複雜度、有趣度等)來量化人工生命,但這些度量基本上都無法完全體現人類想要表達的那種微妙的生命概念。 Sakana AI 表示:「雖然我們還不瞭解我們的宇宙為何或如何變得如此複雜、豐富和有趣,但我們仍然可以將其作為指引,引導我們建立引人入勝的人工生命世界。」 該團隊認為,在大量自然資料上訓練得到的基礎模型具備類似於人類的表徵,甚至可能基於我們的真實世界統計資料得到一個理想化的表徵。這種特性使得基礎模型非常適合用於量化人類對人工生命複雜度的概念。 該團隊的 ASAL(自動搜尋人工生命)研究便是基於這一思路開展的。他們表示這是一種人工生命研究的新正規化。 首先,該團隊將所需的模擬集合定義為 substrate,即基質。然後,如圖 1 所示,ASAL 讓基礎模型可使用三種不同的方法來識別所需的人工生命模擬: 1. 監督式目標:搜尋能產生指定目標事件或事件序列的模擬,有助於發現任意世界或與我們自己的世界相似的世界。 2. 開放式:在基礎模型的表徵空間中搜尋會隨時間不斷提供新變化的模擬,由此可以發現對人類觀察者來說總是很有趣的世界。 3. 闡明(Illumination):搜尋一組相關的多樣化模擬,從而展現對我們來說非常陌生的世界。 研究者基於 Boids、Particle Life(粒子生命)、Game of Life(生命遊戲)、Lenia 和 Neural Cellular Automatas(神經元胞自動機)等多種人工生命基質展現了這種新的自動化方法的有效性。 在每種基質中,ASAL 都發現了以前從未見過的生命形式,並擴充套件了人工生命中湧現結構的邊界。例如,ASAL 揭示了 Boids 中奇異的群集模式、Lenia 中新的自組織細胞,並找到了像著名的康威生命遊戲一樣開放式元胞自動機。 圖 2 展示了新提出的 ASAL 正規化,其中包括三種基於視覺 - 語言基礎模型的演算法。每種方法都能透過不同型別的自動搜尋發現人工生命模擬。深入細節之前,先來看看相關概念和符號。 人工生命基質(substrate),記為 S,其包含任何一組相關的人工生命模擬(例如,所有 Lenia 模擬的集合)。這些模擬可能在初始狀態、轉換規則或兩者上有所不同。S 由 θ 引數化,它定義的單個模擬具有三個分量: 渲染函式,Render_θ,作用是將狀態轉換為影像 雖然通常而言,並不需要引數化和搜尋渲染函式,但當狀態值難以先驗地解讀時,就很有必要了。將這些項串到一起,可定義一個 θ 函式,它對初始狀態 s_0 進行取樣,執行 T 步模擬,並將最終狀態渲染為影像: 最後,還有另外兩個函式 VLM_img (・) 和 VLM_txt (・),它們的作用是 透過視覺 - 語言基礎模型嵌入影像和自然語言文字,以及相應的內積 〈・,・〉,以促進該嵌入空間的相似性測量。 人工生命的一個重要目標是找到能讓所需事件或事件序列發生的模擬。這樣的發現將使研究者能夠找到與我們自己的世界相似的世界,或測試某些反事實的進化軌跡在給定基質中是否可能,從而深入瞭解某些生命形式的可行性。 為此,ASAL 會搜尋一種模擬,該模擬會產生與基礎模型表示中的目標自然語言提示詞相匹配的影像。研究者可以控制在每個時間步驟應用哪個提示(如果有的話)。 人工生命的一大挑戰是尋找開放式模擬。找到這樣的世界才能復現現實世界中永無止境的有趣新奇事物的爆發。 儘管開放性是主觀的且難以定義,但正確表示空間的新穎性(novelty)可以體現開放性的一般概念。這樣一來,可將測量開放性的主觀性外包給表徵函式的構建。在本文中,視覺 - 語言基礎模型表徵充當了人類表徵的代理。 人工生命的另一個關鍵目標是自動闡明不同現象構成的整個空間,而這些現象是從基質湧現出來的。基於此,可以讓我們瞭解「生命的可能模樣」。因此,闡明是描繪和分類整體基質的第一步。 為了實現這一目標,ASAL 會搜尋一組模擬並且這些模擬產生的影像與基礎模型表徵中的最近鄰相距甚遠。該團隊發現最近鄰多樣性比基於方差的多樣效能實現更好的闡明。 該團隊使用不同的基質驗證了 ASAL 正規化的有效性。 首先,他們使用的基礎模型包括 CLIP 和 DINOv2。基質則如下所述: Boids:模擬的是 N 個「鳥狀物體(boids)」在 2D 歐幾里得空間中的移動情況。所有 boids 都共享權重一樣的神經網路,其會根據區域性參考系中 K 個近鄰 boids 向左或向右操縱每個 boid。該基質是神經網路的權重空間。 粒子生命:模擬 N 個粒子,這些粒子又可分為 K 類;它們在一個 2D 歐幾里得空間運動。該基質是 K × K 相互作用矩陣的空間,β 引數確定了粒子之間的距離。初始狀態是隨機取樣的,粒子會自組織形成動態模式。 類生命的元胞自動機(CA:將康威生命遊戲泛化到所有在 2D 柵格中運作的二元狀態元胞自動機,其中狀態轉換僅取決於活著的 Moore 鄰居的數量和細胞的當前狀態。該基質有 2^18 = 262,144 種可能的模擬。 Lenia:將康威生命遊戲推廣到連續空間和時間,允許更高的維度、多個核和多個通道。該團隊使用了 LeniaBreeder 程式碼庫,它定義了基質,其中動態維度為 45 個,初始狀態維度為 32 × 32 × 3 = 3,072 個。其搜尋空間以 Bert Wang-Chak Chan 2020 年在論文《Lenia and expanded universe》中找到的解為中心。 神經元胞自動機(NCA):透過神經網路表示區域性轉換函式來引數化任何連續元胞自動機。該基質是神經網路的權重空間。 對於單個目標,以下動圖定性地展示 ASAL 的良好效果,可以找到與指定提示詞匹配的模擬。 對於時間目標,下圖表明可以找到能產生遵循一系列提示詞的軌跡的模擬。透過指定所需的進化軌跡並使用約束基質,ASAL 可以識別體現所需進化過程本質的更新規則。例如,當提示詞序列為「一個細胞」然後是「兩個細胞」時,相應的更新規則本質上就是實現自我複製。 圖 5 展示了 ASAL 在類生命元胞自動機的開放式模擬中的潛力。 根據 3 式中的開放式指標,著名的康威生命遊戲位列最開放的元胞自動機(CA)的前 5%。 圖 5a 表明,最開放的 CA 表現了處於混沌邊緣的非平凡動態模式,因為它們既沒有穩定也沒有爆發。 圖 5b 則描繪了三個 CA 在 CLIP 空間中隨模擬時間的軌跡。由於基礎模型的表徵與人類表徵相關,因此透過基礎模型的表徵空間在軌跡中產生新穎性也會為人類觀察者產生一系列新穎性。 圖 5c 則視覺化了所有類生命元胞自動機,從中可以看到湧現出的有意義的結構:最開放的 CA 緊密地靠在模擬主島外的一個小島上。 該團隊使用了 Lenia 和 Boids 基質來研究公式 4 中的闡明演算法的有效性。基礎模型是 CLIP 。他們定製了一個用於搜尋的遺傳演算法:在每一代,隨機選擇父母,建立變異的孩子,然後保留最多樣化的解子集。 下面的 2 個「Simulation Atlas」展示了生成的模擬集。 此視覺化凸顯了按視覺相似性組織的行為的多樣性。使用 Lenia 時,ASAL 發現了許多前所未見的生命形式,這些生命形式類似於按顏色和形狀組織的細胞和細菌。使用 Boids 時,ASAL 重新發現了群集行為(flocking behavior),以及其他行為,例如蛇行、分組、盤旋和其它變體。 基礎模型不僅有助於搜尋有趣現象,而且還可以量化以前只能進行定性分析的現象。圖 7 展示了量化這些複雜系統的湧現行為的不同方法。 在圖 7a 中,對兩個 Boids 模擬之間的引數進行線性插值。這個中間模擬缺乏任一模擬的特徵並且顯得無序,表明了 boids 引數空間的非線性、混沌性質。重要的是,現在可以透過測量中間模擬的最終狀態與兩個原始模擬的 CLIP 相似性來為這種定性觀察提供定量支援。 圖 7b 則評估了粒子生命中粒子數量對其表示某些生命形式的能力的影響。在這種情況下,如果搜尋「一隻毛毛蟲(a caterpillar)」,則可發現只有在模擬中至少有 1000 個粒子時才能找到它們,這符合 1972 年的「更多即不同(more is different)」的觀察結果。 在圖 7c 中,透過單獨掃描每個引數並測量 CLIP 提示詞對齊分數的結果標準偏差,量化了粒子生命中每個模擬引數的重要性。在確定最重要的引數後,便對應上了綠色和黃色粒子之間的相互作用強度,這對於毛毛蟲的形成至關重要。 圖 7d 給出了對於 Lenia 模擬,CLIP 向量隨模擬時間的變化速度。當模擬定性地看起來已成靜態時,該指標恰好穩定,因此這可提供有用的模擬停止條件。 https://x.com/SakanaAILabs/status/1871385917342265592 https://x.com/phillip_isola/status/1871438128172671086