ICDM 2019最佳論文：從圖片、文字到網路結構資料翻譯，一種新型的多屬性圖翻譯模型

机器之心小助手發表於2019-11-25

原文網址 : https://www.jiqizhixin.com/articles/2019-11-25-13

文中還提出了一種特殊形式的基於拉普拉斯圖頻譜的正則化方法，來學習和保持圖節點和邊屬性的一致化。最後，在對合成和實際應用資料（物聯網安全最佳化，化學反應預測）的大量實驗證明該方法的有效性和廣泛性。

論文連結：http://mason.gmu.edu/~lzhao9/materials/papers/ICDM_2019_NEC_DGT-final.pdf

背景

在將輸入資料（例如影像，文字）「轉換」為對應的輸出資料的過程中會遇到許多與結構化預測有關的問題，需要學習從輸入域到目標域的轉換對映。例如，影像處理和計算機視覺中的許多問題都可以看作是從輸入影像到相應輸出影像的「翻譯」。這種翻譯問題非常重要並且有極為廣泛的，但實際上卻極為困難，近年來引起了越來越多的關注。

傳統研究只考慮特定結構型別的資料翻譯（轉換）問題，然而在許多實際應用中，需要處理比網格和序列更靈活的結構的資料，因此需要更強大的轉換技術來處理更通用的圖結構資料。現有圖結構翻譯模型有兩種形式，第一種假設來自輸入域和目標域的圖共享相同的圖拓撲結構，但是無法建模或預測圖拓撲的變化, 例如對交通網路中節點處車流量的預測 [1]。第二種只考慮預測圖結構的變化，不考慮節點屬性的變化過程 [2]。

因此，現有的工作要麼根據固定的拓撲結構預測節點屬性，要麼根據固定的節點屬性預測邊的屬性。但是，在許多實際應用中，節點屬性和邊屬性都可以更改。在本文中，這種通用問題被稱為多屬性圖轉換，其在現實世界中有著重要應用範圍，例如從生物結構到功能性腦神經的網路轉換和物聯網安全最佳化問題。

問題概述

首先將輸入圖定義為 ICDM 2019最佳論文：從圖片、文字到網路結構資料翻譯，一種新型的多屬性圖翻譯模型，其中是 N 個圖節點的集合，而是 M 個邊的集合。是代表邊屬性的張量，而 K 是邊屬性的維數。是表示節點屬性的矩陣，其中 D 是節點屬性的維數。同樣，我們將目標圖定義為 ICDM 2019最佳論文：從圖片、文字到網路結構資料翻譯，一種新型的多屬性圖翻譯模型。請注意，目標圖和輸入圖的節點屬性和邊屬性均不同。此外，可能存在向量 C 提供有關轉換過程的一些環境資訊。因此，多屬性圖轉換可以被定義為學習一種對映：

ICDM 2019最佳論文：從圖片、文字到網路結構資料翻譯，一種新型的多屬性圖翻譯模型

多屬性圖轉換問題需要考慮一些獨特的因素對結果的影響，如圖 2 所示：1）邊與邊的互動：在目標域中，邊屬性可能會受到其鄰接邊在輸入域中的屬性的影響，如圖 2(a)。2）節點與邊的互動：在目標域中，邊的屬性可能會受輸入域中其兩個鄰接節點的屬性的影響，如圖 2(b)。3）節點與節點的互動：對於給定的節點，其在輸入域中的屬性; 可能會直接影響該節點在目標域中的屬性，如圖 2(c)。4）邊與節點之間的互動：對於給定節點，其在輸入域中的相關邊屬性可能會影響其在目標域中的屬性，如圖 2(d)。5）頻譜圖屬性：一幅圖中的節點和邊之間會存在複雜的關係，如頻譜圖所反映，在輸入域和目標域中節點與邊具有某些永續性或一致性，這在許多實際應用中也已得到驗證，例如人的大腦網路，如圖 2(e)。如何將以上四種互動模式都融入到模型當中是整個問題的難點之一。

模型概括

ICDM 2019最佳論文：從圖片、文字到網路結構資料翻譯，一種新型的多屬性圖翻譯模型

本文所提出的 NEC-DGT (Node-Edge Co-evolution Deep Graph Translation) 在輸入圖和上下文資訊的條件下對目標域圖進行預測。但是，這種從輸入圖到最終目標圖的轉換過程可能會經歷邊緣和節點之間一系列不同型別的互動。為了學習這種複雜的過程，該文章提出瞭如圖 3 所示的 NEC-DGT 雙路徑多模組。具體地說，將輸入圖的節點和邊的屬性作為輸入，經歷若干模組最終輸出目標圖的節點屬性和邊屬性。每一模組都包含有節點轉換路徑和邊轉換路徑。並利用 skip-connection 的跨模組的連線結構（圖 3 中的黑色虛線）來處理圖轉換過程的非同步特性，從而確保最終轉換的結果充分利用了每一模組資訊的各種組合。為了訓練該圖神經網路模型，基本的損失函式最小化如下：

ICDM 2019最佳論文：從圖片、文字到網路結構資料翻譯，一種新型的多屬性圖翻譯模型

拉普拉斯圖頻譜正則化

1. 基於邊和節點的轉換路徑，我們可以分別生成節點和邊緣屬性。但是，由於這些生成的節點和邊屬性是在不同的路徑中分別預測的，因此它們的模式可不一致。為了探索和確保邊和節點模式的複雜關係，我們提出了一種基於非引數的圖拉普拉斯運算元圖頻譜正則化的正則化方法。我們回顧傳統的拉普拉斯正則化表示式為:

ICDM 2019最佳論文：從圖片、文字到網路結構資料翻譯，一種新型的多屬性圖翻譯模型

傳統的拉普拉斯正則化基於非常嚴格的約束即相連的節點擁有相似的節點屬性，但顯示應用中節點屬性和邊的連線之間有更為複雜的關係。因此，我們用一個非引數的形式去表示圖的拉普拉斯：

ICDM 2019最佳論文：從圖片、文字到網路結構資料翻譯，一種新型的多屬性圖翻譯模型

因此非引數的圖頻譜正則化表示為：

ICDM 2019最佳論文：從圖片、文字到網路結構資料翻譯，一種新型的多屬性圖翻譯模型

2. 目前的正則化複雜度是 O（N），與圖節點的數量線性相關，為了進一步提高該正則化的可擴充套件性，降低複雜度，我們提出一種基於切比雪夫多項式的可擴充套件近似的圖拉普拉斯表示，如下：

ICDM 2019最佳論文：從圖片、文字到網路結構資料翻譯，一種新型的多屬性圖翻譯模型

3. 為了確保學習到的圖頻譜在不同模組生成的圖之間的保持一定程度的一致（整個過程產生的圖同屬一種型別，如人腦網路，化學物質結構，社交網路等），該文章提出的圖頻率正則化不僅允許保持相似性，還允許在某種程度上保留每個塊模式的專有屬性。具體來說，對於學習到的頻率（卷積核），有些對建模節點和圖之間的關係很重要，而有些則不然，導致的稀疏的模式。因此，在多工學習的啟發下，我們使用 L2-1 範數作為正則化學習了頻率的稀疏模式：

ICDM 2019最佳論文：從圖片、文字到網路結構資料翻譯，一種新型的多屬性圖翻譯模型

實驗結果

本文分別在人造資料集和兩個實際資料集上進行了實驗，並分別與三類方法（共 7 種）進行了對比。其中 NEC-DGT（no reg) 作為 baseline 表示該模型不加正則化環節。

ICDM 2019最佳論文：從圖片、文字到網路結構資料翻譯，一種新型的多屬性圖翻譯模型

1. 基於引數衡量的各個資料集的實驗結果：

ICDM 2019最佳論文：從圖片、文字到網路結構資料翻譯，一種新型的多屬性圖翻譯模型

實驗結果表明，NEC-DGT 是現在唯一一個可以進行多屬性圖轉換的模型，並且分別在節點屬性和邊屬性的預測任務中超過其他單任務模型。與 NEC-DGT（no reg) 的對比表示，所提出的圖頻譜正則化對學習過程非常重要。

2. 物聯網安全最佳化任務案例分析：

ICDM 2019最佳論文：從圖片、文字到網路結構資料翻譯，一種新型的多屬性圖翻譯模型

圖 7 研究了 NEC-DGT 輸入圖，實際目標圖和生成目標圖的三種情況。綠色節點表示未感染的裝置，紅色節點表示已感染的裝置。每個邊的寬度反映了兩個裝置之間的距離。在第一行中，在生成的目標圖和實際目標圖中，裝置 4 和 6 均恢復正常，而裝置 19 受到攻擊並與其他裝置隔離。它驗證了我們的 NEC-DGT 成功地找到了轉換節點的規則，並且執行了像真正的限制過程一樣的操作。在第二行，裝置 8 將病毒傳播到裝置 38，該傳播也同樣出現在由 NEC-DGT 生成的圖中。此外，NEC-DGT 不僅可以正確預測節點屬性，還可以同時發現邊屬性的變化，例如在第三行，在生成的目標圖和實際目標圖中都切斷了受損裝置 10 的大多數連線。

本文提出的 NEC-DGT 模型的程式碼和資料網路連結已在論文中公開，歡迎使用。

歡迎郵件聯絡 xguo7@gmu.edu 或者 lzhao9@gmu.edu.

文獻：

[1] Yu, B., Yin, H., & Zhu, Z. (2017). Spatio-temporal graph convolutional networks: A deep learning framework for traffic forecasting. arXiv preprint arXiv:1709.04875.

[2] X. Guo, L. Wu, and L. Zhao,「Deep graph translation,」arXiv preprint arXiv:1805.09980, 2018.

NDT論文翻譯
2024-07-31
TransH論文翻譯
2020-12-06
文字識別——檢測部分 CTPN論文翻譯
2018-09-13
A3C論文翻譯
2020-10-11
從冷戰到深度學習：一篇圖文並茂的機器翻譯史
2018-03-16
深度學習
[翻譯]資料結構——trie樹介紹
2019-02-28
資料結構
iOS15上線圖片翻譯功能，能取代專業翻譯軟體嗎？
2021-07-22
iOS
有道自然語言翻譯和文字識別OCR(圖片文字識別)介面呼叫
2019-04-04
Serilog文件翻譯系列（四） - 結構化資料
2024-09-06
蝴蝶書-task2: 文字推理、摘要、糾錯 transformers實現翻譯 OpenAI翻譯 PyDeepLX翻譯 DeepLpro翻譯
2024-04-29
ORMOpenAI
一個好用的支援多種方式翻譯的包
2018-07-19
[翻譯]map和reduce，處理資料結構的利器
2019-02-25
資料結構
程式翻譯新突破：UC伯克利提出樹到樹的程式翻譯神經網路
2018-11-06
神經網路
ICLR 2020滿分論文解讀 | 一種映象生成式機器翻譯模型：MGNMT
2020-01-11
ICLR模型
Python批量圖片識別並翻譯——我用python給女朋友翻譯化妝品標籤
2020-10-29
Python
請豆包幫忙總結翻譯一個網站，翻譯效果還不錯
2024-10-18
網站
OpenCV翻譯專案總結二——Mat翻譯
2019-07-13
OpenCV
多翻譯引擎的程式
2021-06-11
論文翻譯：2021_論文翻譯：2018_F-T-LSTM based Complex Network for Joint Acoustic Echo Cancellation and Speech Enhancement
2022-03-24
人人都有可能需要的圖片識別方法，還可以翻譯
2021-03-08
【跟蹤演算法】MOSSE論文翻譯
2018-10-24
演算法
線上文字翻譯能力新增14個直譯模型，打造以中文為軸心語言的翻譯系統
2023-02-28
模型
告別生硬翻譯！AI谷歌翻譯：讓你的文字"說人話"
2024-11-11
AI谷歌
從資料結構到演算法：圖網路方法初探
2019-08-23
資料結構演算法
從規則到神經網路：機器翻譯技術的演化之路
2023-12-26
神經網路
【翻譯】WPF中的資料繫結表示式
2021-05-08
最佳 AI 翻譯工作流：全世界最信達雅的翻譯
2024-07-23
AI
ICLR 2020 | 多模態下使用圖片資訊顯著增強機器翻譯效果
2020-09-22
ICLR
【深度學習論文篇 01-1 】AlexNet論文翻譯
2022-04-05
深度學習
論文翻譯：2019_Deep Neural Network Based Regression Approach for A coustic Echo Cancellation
2021-12-28
APP
OpenCV翻譯總結
2019-09-21
OpenCV
翻譯文字 API說明示例
2023-04-10
API
500億引數，支援103種語言：谷歌推出「全球文字翻譯」模型
2019-10-13
谷歌模型
102個模型、40個資料集，這是你需要了解的機器翻譯SOTA論文
2019-10-28
模型
[論文翻譯]Polar Transformation Network(Polar-STN，PTN)
2020-11-01
ORM
超長小說可以用AI翻譯了，新型多智慧體協作系統媲美人工翻譯
2024-06-03
AI智慧體
Python 使用白嫖網易翻譯 API 進行翻譯
2020-04-11
PythonAPI
翻譯
2020-12-29

ICDM 2019最佳論文：從圖片、文字到網路結構資料翻譯，一種新型的多屬性圖翻譯模型

相關文章