靈活、輕便，阿里開源簡化GNN應用框架Graph-Learn

機器之心發表於2020-04-03

原文網址 : https://www.jiqizhixin.com/articles/2020-04-03-6

近年來，圖神經網路（GNN）已經在影像分類、語義分割、推薦系統、程式推理乃至分子結構預測等領域，都有著越來越廣泛的應用。GNN 一般是將底層圖形作為計算圖，通過在圖上傳遞、轉換和聚合節點特徵資訊學習神經網路基元以生成單個節點嵌入。生成的節點嵌入可以作為輸入，用於如節點分類或連線預測的任何可微預測層，完整的模型可以通過端到端的方式訓練。

近日，阿里巴巴團隊開源了 Graph-Learn（以下簡稱 GL），這是一個用以簡化圖神經網路應用的新框架。它能夠從實際的案例中提取出解決方案，並且這些解決方案已在推薦、反欺騙和知識圖譜系統領域得到了應用和驗證。

GL 的可移植性和靈活性對於開發者來說十分友好，在該框架的基礎上，開發者可以更輕鬆地實現 GNN 演算法、自定義與圖相關的運算子，並且更輕鬆地擴充現有模組。Container 和物理機上都可以安裝 GL。

專案地址：https://github.com/alibaba/graph-learn

模型示例

GCN

圖卷積網路被認為是基於深度學習的圖形結構化資料方法最突出的進展之一。GCN 上的卷積運算元是頻譜圖卷積的部分近似。從空間角度來看，相鄰節點的嵌入被聚合在一起用以更新節點的自嵌入。

靈活、輕便，阿里開源簡化GNN應用框架Graph-Learn

GAT

圖注意力網路是 GCN 接下來的主要工作。GAT 將注意力機制融入了 GCN。通過計算節點之間的注意力係數，GAT 對節點及其相鄰進行加權彙總，從而使得每個節點都能專注於最相關的相鄰項從而進行決策。

靈活、輕便，阿里開源簡化GNN應用框架Graph-Learn

GraphSAGE

GraphSAGE 是一個通用的歸納框架，可以有效地為之前無法視覺化的資料生成節點嵌入。為了利用大規模圖形資料，GraphSAGE 會建議從原始圖形資料中取樣計運算元圖形，然後進行逐批訓練。以及它還提出了通過幾個 aggregators 來有選擇地聚合相鄰項的嵌入。

靈活、輕便，阿里開源簡化GNN應用框架Graph-Learn

快速開始

以最流行的圖神經網路模型 GCN 為例，這部分展示一下如何基於 low-level 的 GL API 和深度學習框架（比如 TensorFlow）構建圖學習模型。

如何建立一個基於學習的模型

需要執行以下四個步驟：

取樣：使用內建取樣函式取樣子圖（稱為 EgoGraph）。
團隊抽象了四個基本函式，包括sample_seed，positive_sample，negative_sample 和receptive_fn。sample_seed 用於生成初始 Nodes 以及 Edges（一系列節點或邊緣），然後 positve_sample 將其用作輸入以生成樣本 Edges。negative_sample 函式可對非監督模型的負 Nodes 或 Edges 進行取樣。GNN 需要聚集 nodes（edges）的相鄰資訊以便更新 nodes 及 edges 嵌入，因此提供了 acceptive_fn 來取樣相鄰資訊。種子 Nodes 和 Edges 以及取樣被統一組織為 EgoGraph。

圖形流：使用 EgoFlow 時會根據不同的後端將 EgoGraph 轉換為 EgoTensor。
GL 建模是基於 TensorFlow 等深度學習框架之上的。因此，需要將取樣的EgoGraphs 轉換為張量格式 EgoTensor。團隊將 EgoFlow 進行此轉換。EgoFlow 還生成用於迭代訓練和 pipeline 的 iterator。

定義編碼器：使用 EgoGraph 編碼器和功能編碼器對 EgoTensor 進行編碼。
獲取 EgoTensor 之後，需要定義從原始資料到嵌入的轉換例程。而對於 GNN 模型，此步驟是聚合節點並將其與自身節點的 nodes/edges 合併。

定義損失函式和訓練：將編碼的嵌入內容提供給損失函式及訓練。
GL 內建了一些常見的損失函式和優化器，也可以自定義自己的損失函式和優化器。同時支援本地和分散式培訓。

主要概念

源資料

GL 支援多種資料格式，用以簡化從原始資料到 Graph 物件的整個構建過程。源資料放置在檔案系統上，建模時，載入程式會將檔案讀取為 StructuredAccessFile。

對於使用者而言，提供了兩類源資料：Node Source 以及 Edge Source。這裡將其描述為 Node Source 和 Edge Source 支援的資料格式。

通常情況下，節點包含一個 ID 以及多個描述實體的屬性。Edge 包含兩個 ID，用於描述兩個節點之間的關係。Edges 也可能附加了屬性。例如，「使用者在星期六早上購買了產品」。它使用了使用者和產品 ID 描述 Edge，「星期六早上」是該 Edge 的屬性。

除屬性外，GL 還支援源資料中的權重和標籤。權重對於許多采樣演算法很重要，而標籤是監督訓練的必備條件。

如上所述，GL 使用 WEIGHTED，LABELED 和 ATTRIBUTED 作為基本 ID 的可選擴充套件。

圖形物件

Graph 是一個組織原始資料的單元，用以啟用高階操作。GL 作業中只能存在一個且是唯一的 Graph 物件。能夠支援所有型別的圖，包括同構圖，具有不同型別 nodes 或 edges 的異構圖或是以及具有附加在 nodes 或 edges 上屬性的圖。提供豐富的 API 來提取有關圖形的資訊。

通常來說，建立圖形物件需要以下三個步驟：

宣告一個 Graph 物件
描述出其拓撲性
初始化資料

分散式模式

GL 支援分散式模式執行的伺服器或客戶端以及其任意組合。伺服器角色負責載入和管理圖形。客戶端與深度學習框架在同一過程中執行，以提供圖形資料進行訓練。在訓練期間，將從客戶端生成資料的查詢或取樣請求，在伺服器中對其進行處理。最後，伺服器的結果被聚合回客戶端。

靈活、輕便，阿里開源簡化GNN應用框架Graph-Learn

「伺服器」和「客戶端」只是 GL 中的邏輯層面的角色，它們也可以放在同一臺機器上。

【開源】Tsar——靈活的系統和應用採集軟體
2018-07-10
DeepMind開源強化學習環境，場景靈活介面簡單，推特高贊
2019-08-20
強化學習
LLM大模型部署實戰指南：Ollama簡化流程，OpenLLM靈活部署，LocalAI本地最佳化，Dify賦能應用開發
2024-08-14
大模型AI
靈活運用JavaScript開發技巧
2019-05-06
JavaScript
C# 輕量級 ORM 框架 NPoco 的簡單應用
2024-07-10
C#ORM框架
架構簡潔之道：從阿里開源應用架構 COLA 說起
2020-07-09
阿里應用架構
Solon 1.6.25 釋出，輕量級應用開發框架
2022-02-23
框架
Solon 1.6.18 釋出，輕量級應用開發框架
2022-01-22
框架
Android示例應用：開源框架Glide的使用
2019-12-25
Android框架IDE
打造靈活可擴充套件的前端工程化框架
2019-05-07
套件前端框架
新移動框架中企業自建應用的來源是【移動輕應用管理】
2024-05-09
框架
阿里雲——輕量應用伺服器
2022-11-29
阿里伺服器
pythontonado框架簡單應用
2018-12-19
Python框架
FinClip 與 uniapp：輕應用平臺與前端開發框架
2022-01-04
APP前端框架
虛擬串列埠工具MCGS開發除錯的靈活應用教程
2022-11-08
串列埠除錯
開源協助平臺工程靈活應對多雲時代的挑戰
2024-01-03
Dopamine - 靈活、可重複的強化學習研究新框架
2018-09-05
強化學習框架
Cognita: 開源RAG框架助力生產級應用開發
2024-10-12
框架
EasyExcel 輕鬆靈活讀取Excel內容
2019-10-22
Excel
阿里巴巴開源路由框架 - ARouter 分析
2018-10-10
阿里路由框架
開源推薦，靈活多變功能強大的CMDB
2023-11-23
靈活運用JS開發技巧(66個實用技巧)
2019-10-21
JS
Spring 5| 輕量級的開源JavaEE框架
2021-12-20
SpringJava框架
免費，程式碼開源，thinkphp5開發的fivecms內容管理系統,輕便簡潔，易於操作。
2019-05-11
PHP
Galileo：一款開源Web應用審計框架
2018-06-06
Web框架
邊緣計算開源框架EdgeXFoundry的部署應用開發
2020-11-16
框架
創業者需要的品質：靈活！靈活！靈活
2022-02-28
創業
正規表示式如何在PHP裡靈活的應用
2022-03-21
PHP
Java設計模式——觀察者模式的靈活應用
2020-11-26
Java設計模式
阿里分散式事務框架GTS開源啦！
2019-01-12
阿里分散式框架
?Slow Admin - 快速且靈活的後臺框架
2022-11-12
框架
iOS一個靈活可擴充套件的開源Log庫
2018-05-22
iOS套件
更簡單靈活地管理 Ruby 版本
2019-02-16
剛剛，阿里開源 iOS 協程開發框架 coobjc！
2019-02-28
阿里iOS框架OBJ
SimpleFlatMapper是一款微型但靈活強大的開源資料庫記錄行對映框架
2020-04-20
APP資料庫框架
阿里巴巴的雲原生應用開源探索與實踐
2019-11-14
阿里
應用DMAIC減少偏心套軸承轉動不靈活
2021-11-30
AI
[Android開源]：EasyGuideLayer: 這可能是最簡單、靈活、強大的頁面蒙層元件了！
2018-12-03
AndroidGUIIDE元件

靈活、輕便，阿里開源簡化GNN應用框架Graph-Learn

相關文章