Transformer中的位置編碼(Positional Encoding)

Mintisn發表於2024-10-19

原文網址 : https://www.cnblogs.com/Mintisn/p/18475776

Transformer中的位置編碼(Positional Encoding)

標準位置編碼

原理上Transformer是無法隱式學到序列的位置資訊的，為了可以處理序列問題，Transformer提出者的解決方案是使用位置編碼（Position Encode/Embedding，PE)^[1]^[2] . 大致的處理方法是使用sin和cos函式交替來建立位置編碼PE, 計算公式如下:

\[PE_{t,2i}=\sin(t/10000^{2i/d}),\\PE_{t,2i+1}=\cos(t/10000^{2i/d}), \]

在這個公式中, \(t\) 表示的是token的位置, \(i\) 表示的是位置編碼的維度

他的最終視覺化效果長這樣

位置編碼的作用, 就簡而言之就是將每個位置編號，從而每個編號對應一個向量，最終透過結合位置向量和詞向量，作為輸入embedding，就給每個詞都引入了一定的位置資訊，這樣Attention就可以分辨出不同位置的詞了^[3],這篇文章^[3:1]有標準位置編碼的具體實現.

旋轉位置編碼(RoPE)

reference

[1706.03762] Attention Is All You Need (arxiv.org) ↩︎
Transformer改進之相對位置編碼(RPE) - 知乎 (zhihu.com) ↩︎
一文通透位置編碼：從標準位置編碼、旋轉位置編碼RoPE到ALiBi、LLaMA 2 Long(含NTK-aware簡介)-CSDN部落格 ↩︎ ↩︎

[NLP] 相對位置編碼(二) Relative Positional Encodings - Transformer-XL
2019-07-26
EncodingORM
SciTech-BigDataAIML-LLM-PE(Positional Encoding)位置編碼: Absolute(絕對)Position + Relative(相對)Position + Rotate(旋轉)Position
2024-08-22
AIEncoding
transformer的位置編碼具體是如何做的
2024-08-10
ORM
[LeetCode] Short Encoding of Words 單詞集的短編碼
2018-12-08
LeetCodeEncoding
設計位置編碼
2024-12-03
Redis 資料結構與物件編碼 (Object Encoding)
2020-10-31
Redis資料結構物件ObjectEncoding
Python實現類別變數的獨熱編碼（One-hot Encoding）
2023-02-15
Python變數Encoding
JIT 編譯後的程式碼儲存位置
2024-12-10
編譯
解決Python在windows平臺預設編碼(encoding)為gbk所導致的open()函式報錯及其他編碼問題
2018-10-26
PythonWindowsEncoding函式
python中的編碼&解碼
2024-08-31
Python
【轉知乎回答】一文看懂 LLaMA 中的旋轉式位置編碼（Rotary Position Embedding）
2024-07-19
【搬磚筆記】利用GeoHash為地理位置編碼
2019-05-12
筆記
超越單詞計數：上下文位置編碼CoPE
2024-05-30
## HTTP系列之Accept-Encoding和Content-Encoding
2019-04-08
HTTPEncoding
python中字串的編碼和解碼
2020-11-29
Python字串
node編碼中的坑
2019-03-03
[特徵工程] encoding
2021-12-12
特徵工程Encoding
android程式碼中動態調整圖片的位置
2020-10-21
Android
transformer中的attention機制詳解
2024-07-02
ORM
Transformer模型中的權重矩陣
2024-06-04
ORM模型矩陣
java中的編碼簡介
2020-04-06
Java
【雜學】先進的 NLP 技術 —— 旋轉位置編碼（Rotary Position Embedding，RoPE）
2024-11-11
GO 中 ETCD 的編碼案例分享
2021-06-19
Go
Jmeter 上傳檔案時勾選與瀏覽器相容的頭後編碼依舊使用了 Content-Transfer-Encoding
2020-08-17
JMeter瀏覽器Encoding
but no encoding declared;問題的解決方法
2024-03-14
Encoding
Java 8中的Base64編碼和解碼
2019-03-26
Java
Ubuntu中 MySQL 的中文編碼問題
2018-09-18
UbuntuMySql
C++中的字串編碼處理
2023-05-15
C++字串編碼
Kitty-Cloud中的編碼規範
2020-04-30
Cloud
Spring Security 5中的預設密碼編碼器
2019-05-27
Spring密碼
Rust中字串的base64編碼與解碼
2022-09-21
Rust字串
Enhanced Invertible Encoding for Learned Image Compression
2024-04-26
Encoding
[HTTP] HTTP 協議 Response Header 之 Content-Length、Transfer-Encoding與Content-Encoding
2024-07-30
HTTP協議HeaderEncoding
netty系列之:netty中的懶人編碼解碼器
2021-08-20
Netty
transformer
2021-02-17
ORM
MySQL 中字元編碼問題
2019-12-24
MySql字元
Widows中伺服器中cookie檔案的位置
2024-10-03
伺服器Cookie
五顏六色的程式碼：論程式碼的正確位置
2019-02-21

Transformer中的位置編碼(Positional Encoding)

Transformer中的位置編碼(Positional Encoding)

標準位置編碼

旋轉位置編碼(RoPE)

相關文章