sequence to sequence模型

-牧野-發表於2018-05-16

原文網址 : https://blog.csdn.net/dcrmg/article/details/80327069

sequence to sequence模型是一類End-to-End的演算法框架，也就是從序列到序列的轉換模型框架，應用在機器翻譯，自動應答等場景。

Seq2Seq一般是通過Encoder-Decoder（編碼-解碼）框架實現，Encoder和Decoder部分可以是任意的文字，語音，影象，視訊資料，模型可以採用CNN、RNN、LSTM、GRU、BLSTM等等。所以基於Encoder-Decoder，我們可以設計出各種各樣的應用演算法。

與Seq2Seq框架相對的還有一個CTC，CTC主要是利用序列區域性的資訊，查詢與序列相對的另外一個具有一對一對應關係（強相關，具有唯一性）的序列，比較適用於語音識別、OCR等場景。

而Seq2Seq更善於利用更長範圍的序列全域性的資訊，並且綜合序列上下文判斷，推斷出與序列相對應的另一種表述序列（非強相關，不具有唯一性），比較適用於機器翻譯、文章主旨提取等場景。

從範圍上來說，CTC是狹義的，Seq2Seq是廣義的，從結果上來說，CTC是強制的一對一對應關係，Seq2Seq是具有弱約束的多對多對應關係。

經典的Encoder-Decoder框架：

左側Encoder編碼將輸入序列轉化成一個固定長度的向量編碼，右側Decoder解碼將之前生成的固定向量再轉化成輸出序列，編解碼部分可以採用CNN、RNN、LSTM、GRU、BLSTM等實現。

Encoder-Decoder模型可以預測任意的序列對應關係，但同時也有一個很大的問題就是從編碼到解碼的準確率很大程度上依賴於一個固定長度的語義向量c，輸入序列到語義向量c的壓縮過程中存在資訊的丟失，並且在稍微長一點的序列上，前邊的輸入資訊很容易被後邊的輸入資訊覆蓋，也就是說編碼後的語義向量c已經存在偏差了，解碼準確率自然會受到影響。其次在解碼的時候，每個時刻的輸出在解碼過程中用到的上下文向量是相同的，沒有做區分，也就是說預測結果中每一個詞的的時候所使用的預測向量都是相同的，這也會給解碼帶來問題。

為了解決這樣的問題，在Seq2Seq模型加入了注意力機制（attention mechanism），在預測每個時刻的輸出時用到的上下文是跟當前輸出有關係的上下文，而不是統一隻用相同的一個。這樣在預測結果中的每個詞彙的時候，每個語義向量c中的元素具有不同的權重，可以更有針對性的預測結果。

圖示如下，增加了一個“注意力範圍”，表示接下來輸出詞時候要重點關注輸入序列中的哪些部分，然後根據關注的區域來產生下一個輸出：

attention模型最大的不同在於Encoder將輸入編碼成一個向量的序列，而在解碼的時候，每一步都會選擇性的從向量序列中挑選一個子集進行輸出預測，這樣，在產生每一個輸出的時候，都能找到當前輸入對應的應該重點關注的序列資訊，也就是說，每一個輸出單詞在計算的時候，參考的語義編碼向量c都是不一樣的，所以說它們的注意力焦點是不一樣的。

Sequence recognition
2024-04-16
uvm的sequence
2018-08-09
PostgreSQL 序列（Sequence）
2023-11-05
SQL
ORACLE SEQUENCE用法
2020-11-10
Oracle
python sequence序列
2019-05-18
Python
Rainbow Bracket Sequence
2024-09-18
AIRacket
Increasing Sequence with Fixed OR
2024-08-11
PostgreSQL sequence (一)
2022-03-07
SQL
論文閱讀：Sequence to sequence learning for joint extraction of entities and relations
2024-07-29
FSM:Sequence 1101 recognizer
2024-04-16
F - Two Sequence Queries
2024-06-09
裁剪序列Cut the Sequence
2024-06-08
DeepLearning – Overview of Sequence model
2018-04-15
View
E. Block Sequence
2024-06-02
BloC
mysql實現sequence
2020-12-17
MySql
LeetCode 444 sequence reconstruction
2020-11-28
LeetCodeStruct
[LeetCode]60. Permutation Sequence
2018-11-14
LeetCode
HDU 1711 Number Sequence(KMP)
2020-04-06
KMP
A Proof of Golden Section of Fibonacci Sequence
2024-06-24
Go
oracle的scn及sequence
2023-01-16
Oracle
[AGC031D]A Sequence of Permutations
2019-03-17
GC
演算法題 - Pop Sequence
2024-03-11
演算法
HDU 6047 Maximum Sequence (貪心)
2020-04-06
Least Cost Bracket Sequence（貪心）
2020-05-18
ASTRacket
從SEQUENCE跳號說起
2019-06-12
[ABC234G] Divide a Sequence
2024-09-26
IDE
abc134E - Sequence Decomposing
2024-07-13
[20220321]探究oracle sequence.txt
2022-03-23
Oracle
Keras版Sequence2Sequence對對聯實戰——自然語言處理技術
2020-09-29
Keras自然語言處理
吳恩達《序列模型》課程筆記（3）– Sequence models & Attention mechanism
2018-08-02
吳恩達模型筆記
HDU 6299-Balanced Sequence(貪心)
2018-09-01
Leetcode 298 Binary Tree Longest Consecutive Sequence
2018-09-05
LeetCode
不同於Oracle：SEQUENCE的區別
2024-04-08
Oracle
[題解]CF13C Sequence
2024-05-01
[題解]P4597 序列 sequence
2024-05-01
CCPC Final 2023 B. Periodic Sequence
2024-11-06
[20220322]探究oracle sequence 2.txt
2022-03-23
Oracle
1455D. Sequence and Swaps(思維)
2020-11-30

sequence to sequence模型

相關文章