AIxiv專欄是機器之心釋出學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報導了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯絡報導。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
結構異質性:應對圖結構資訊中的分佈偏移。 特徵異質性:處理跨圖資料集的多樣特徵表示。 快速適配:使模型迅速適應新的不同的圖學習領域,展現敏捷適應力。 大模型能力湧現:隨著資料量和模型引數的增長,效能顯著提升,釋放模型潛能。
圖混合專家(GraphMoE):採用一系列專家模型,巧妙解決跨域異質性問題。 輕量級圖專家路由機制:快速適應策略,使模型能夠迅速響應新的資料集和領域。 自適應且高效的圖專家模型:專為處理具有廣泛圖結構模式和特徵空間的模型而定製設計。 廣泛訓練和測試:在 38 個多樣化的圖資料集上經過嚴格驗證,展現出卓越的泛化能力和模型擴充套件性,證明了其湧現能力。
論文連結: https://arxiv.org/pdf/2408.10700 專案地址: https://github.com/HKUDS/AnyGraph 實驗室主頁: https://sites.google.com/view/chaoh
結構異質性:不同應用領域的圖資料在結構上可以存在極大的差別,例如節點的平均度數、緊密子圖出現的頻率、噪音和缺失邊資料的比例等。圖結構模式的多樣性,對圖基礎模型的容納能力提出了嚴重的挑戰。 特徵異質性:作為圖資料的重要組成部份,節點特徵在不同資料集中卻存在普遍且極大的差異。例如,有的資料集採用離散的類別特徵,有的可能採用連續的數值特徵,有的採用文字語意 embedding,有的採用圖結構的統計資訊。此外,不同資料集的節點特徵在向量維度這一基本特點上甚至都具有極大的差異。如何使圖基礎模型在零樣本情況下處理不同圖的異質特徵,是一個關鍵挑戰。 快速適應以實現廣泛應用。有效的圖基礎模型的關鍵能力之一是能夠高效地適應新的圖資料集和領域。理想模型應能夠迅速調整其引數和學習策略,以處理之前未見過的圖資料集的結構和分佈特徵,而無需進行大量的重新訓練或微調。 圖基礎模型的擴充套件定律與變革效能力。在計算機視覺和自然語言處理等領域中,成功的基礎模型具有一個關鍵特性 —— 擴充套件定律(Scaling Law),即隨著模型大小或訓練資料集的增加,效能會系統地提升。探索圖基礎模型是否適用這一定律,也是本文研究的一個重要問題。
左:在模型引數量影響下,對未見過資料集的零樣本預測效能變化 中:在模型引數量影響下,對訓練過資料集的全樣本預測效能變化 右:在訓練資料量影響下,對未見過資料集的零樣本預測效能變化
AnyGraph 的零樣本能力遵循 Scaling Law:雖然模型的全樣本預測能力出現了增長的飽和,但其零樣本能力隨著引數量和資料量的增長不斷上升,這說明 AnyGraph 模型的零樣本能力遵循 Scaling Law,這一觀測結果有兩個重要原因,首先是測試的任務需要具備一定的難度,全樣本預測只需要模型在訓練資料集上具備泛化能力,相對較為簡單,因此容易出現效能增長的飽和;而跨資料集、跨領域的零樣本預測挑戰性高,仍有很大的增長空間。其次,AnyGraph 的 MoE 架構使得它更容易容納不同資料集的多樣化圖資料模式,從而具備更大的潛力隨著引數量和資料量的增大而提升。 AnyGraph 的湧現能力:在測試曲線中常常可以觀測到,模型效能常常在經歷了一定的增長停滯後,出現突變式提升。這符合在視覺和文字大模型中觀測到的湧現能力特點,說明 AnyGraph 具備了產生變革式泛化能力的基礎。 不足的訓練資料引入 bias:在資料量增長實驗中可以觀察到一個典型的特徵,在早起的資料量增長中,模型效能經歷了一個斷崖式的下跌,這是由於訓練資料不足,而新引入的訓練資料與測試資料集存在較大的偏離,導致模型訓練存在較大的 bias。這一問題可以透過擴大訓練資料量解決,這樣做不僅增強了模型效能,也可以增強訓練的魯棒性。