論文閱讀：Sequence to sequence learning for joint extraction of entities and relations

Barn發表於2024-07-29

用以解決重疊關係問題

GGNNs模型

GGNNs（門控圖神經網路，Gated Graph Neural Networks）是一種處理圖結構資料的神經網路模型。它是圖神經網路（GNN）的一個變體，使用了類似於長短時記憶網路（LSTM）中的門控機制來更有效地處理圖中的資訊流。

GGNNs的核心機制

GGNNs的核心思想是透過在圖結構中使用帶門控的迴圈神經網路（如GRU或LSTM）來更新節點的狀態。這種結構使得網路能夠在多個時間步內維持和傳遞節點狀態，進而捕捉節點間長距離的依賴關係。

GGNNs的組成

節點狀態更新：每個節點的狀態是透過考慮其鄰居的狀態來更新的。這一過程通常使用GRU（門控迴圈單元）來實現，其中節點的當前狀態和從鄰居聚合的資訊共同決定了節點狀態的更新。
資訊聚合：資訊從節點的鄰居那裡聚合，通常使用加權和的形式。權重可以是固定的，也可以是透過學習得到的，依賴於節點間的關係型別。
門控機制：門控機制幫助模型決定在每個時間步應該保留多少舊狀態，以及接受多少新的輸入資訊。這是透過一個sigmoid啟用函式來實現的，它輸出一個在0到1之間的值，作為更新的權重。

本文提出的模型

由編碼器和解碼器兩部分組成。

編碼器模組包含嵌入層、Bi-LSTM層和GGNNs層。
解碼器模組包含注意力層和LSTM關係元組生成層。

編碼器

首先建立了一個字典詞彙表V，其中包含原始句子token、預定義的關係集R、兩個特殊的分隔標記（";"和"and"）、起始目標標記（SOS）和未知詞標記（UNK）。

嵌入層

嵌入層包括單詞嵌入層和字元嵌入層。
給定一個句子x，它包含n個token和目標實體-關係三元組。

首先，根據字典詞彙V將輸入標記轉換為數字身份，然後利用預訓練的詞嵌入權重引數來初始化輸入句子token，得到\(w_i^0\)。
接著，採用具有Max-pooling函式的卷積神經網路來提取每個單詞的特徵向量，得到\(w_i^1\)。
因此，輸入表示為\(W_i = [w_i^0,w_i^1]\)。

Bi-LSTM層

由於Bi-LSTM具有很強的句子語義特徵提取能力，我們透過一層Bi-LSTM對詞嵌入進行獲取，以獲取每個詞的詞隱藏狀態。

首先，前向 LSTM 將詞順序地嵌入到詞隱藏狀態\(\overrightarrow{h_i}\)中。
其次，後向 LSTM 將輸入詞嵌入到隱藏狀態\(\overleftarrow{h_i}\)中。
最後，我們得到每個詞的詞表示：\(h_i = [\overrightarrow{h_i}, \overleftarrow{h_i}]\)。

GGNNs層

為了更好地將區域特徵與序列結構化特徵相結合，我們透過依賴邊緣、自邊緣、前向邊緣和後向邊緣的關係建立了每個節點的邊緣\(M\)。並利用GGNNs層來保持整個句子的圖和序列結構。

\[g_i = GGNNs(M, h_i) \]

解碼器

為了預測關係元組，採用一層單向LSTM作為解碼器模組。

在每個訓練階段 t，單向 LSTM 採用目標詞嵌入\(y_i\)和編碼上下文隱藏狀態\(h_i\)來預測新的解碼隱藏階段。

\[s_t = LSTM(h_{t-1}, y_{t-1}, s_{t-1}) \]

採用Bahdanau注意力機制來獲取每個單詞的上下文表示。
最後，透過線性連線運算得到每個生成的詞的機率值：

\[r_t = We_t + b \]

在訓練過程中，我們採用交叉熵來最佳化生成的令牌和直接的目標標籤令牌。
然而，在推理過程中，解碼器生成了一個在原始句子中找不到的單詞、特殊標記和關係集 R。
因此，使用掩碼方法（在對映層利用了Softmax函式），解決訓練階段和推理階段的不一致問題。

Liang Z, Du J. Sequence to sequence learning for joint extraction of entities and relations[J]. Neurocomputing, 2022, 501: 480-488.

【論文閱讀】Informer Beyond Efficient Transformer for Long Sequence Time-Series Forecasting
2024-03-12
ORMAST
論文閱讀：A neuralized feature engineering method for entity relation extraction
2024-07-29
Zed
【論文閱讀筆記】An Improved Neural Baseline for Temporal Relation Extraction
2020-11-20
筆記
論文閱讀：《Learning by abstraction: The neural state machine》
2022-04-10
Mac
論文閱讀 Inductive Representation Learning on Temporal Graphs
2022-07-11
讀論文-序列感知推薦系統(Sequence-Aware Recommender Systems)
2024-04-11
sequence to sequence模型
2018-05-16
模型
論文閱讀-Causality Inspired Representation Learning for Domain Generalization
2024-04-09
AI
論文閱讀 TEMPORAL GRAPH NETWORKS FOR DEEP LEARNING ON DYNAMIC GRAPHS
2022-07-17
【論文閱讀】CVPR2022: Learning from all vehicles
2022-03-23
[論文閱讀筆記] Adversarial Learning on Heterogeneous Information Networks
2021-06-05
筆記ORM
閱讀論文：《MuKEA: Multimodal Knowledge Extraction and Accumulation for Knowledge-based Visual Question Answering》
2022-03-30
論文閱讀：Robust and Privacy-Preserving Collaborative Learning: A Comprehensive Survey
2022-12-01
[論文閱讀筆記] Adversarial Mutual Information Learning for Network Embedding
2021-06-12
筆記ORM
論文閱讀《Beyond a Gaussian Denoiser: Residual Learning of Deep CNN for Image Denoising》
2024-04-07
CNN
Beyond Fixed Grid: Learning Geometric Image Representation with a Deformable Grid——論文閱讀
2020-10-09
ORM
論文閱讀翻譯之Deep reinforcement learning from human preferences
2024-09-11
Sequence recognition
2024-04-16
2018-07-28-論文閱讀（1）-Learning Ensembled for Structured Prediction Rules
2018-07-28
Struct
論文閱讀：SiameseFC
2018-04-09
論文閱讀20241117
2024-11-22
GeoChat論文閱讀
2024-10-29
論文解讀（GCC）《Efficient Graph Convolution for Joint Node RepresentationLearning and Clustering》
2022-06-28
GC
[論文閱讀筆記] metapath2vec: Scalable Representation Learning for Heterogeneous Networks
2020-12-27
筆記
論文閱讀：LDP-FL: Practical Private Aggregation in Federated Learning with Local Differential Privacy
2020-12-04
uvm的sequence
2018-08-09
PostgreSQL 序列（Sequence）
2023-11-05
SQL
ORACLE SEQUENCE用法
2020-11-10
Oracle
python sequence序列
2019-05-18
Python
Rainbow Bracket Sequence
2024-09-18
AIRacket
Increasing Sequence with Fixed OR
2024-08-11
PostgreSQL sequence (一)
2022-03-07
SQL
論文解讀（Debiased）《Debiased Contrastive Learning》
2022-04-28
AST
Zero-shot Learning零樣本學習論文閱讀（三）——Semantic Autoencoder for Zero-Shot Learning
2020-12-27
阿里DMR論文閱讀
2024-04-29
阿里
[論文閱讀] Hector Mapping
2020-12-16
APP
論文閱讀 dyngraph2vec: Capturing Network Dynamics using Dynamic Graph Representation Learning
2022-06-11
APT
並行多工學習論文閱讀（五）：論文閱讀總結
2021-11-12
並行