【雜學】先進的 NLP 技術 —— 旋轉位置編碼（Rotary Position Embedding，RoPE）

KeanShi發表於2024-11-11

原文網址 : https://www.cnblogs.com/keanshi/p/18540794

Transformer 已經漸漸成為目前 LLM 最通用底層架構之一，其中的位置編碼也顯得極其重要，由於注意力分數本質上是每個 token 的 val 加權和，並沒有考慮其中的空間資訊，因此需要在自注意力模組之前就將位置資訊融合進序列中。

絕對位置編碼

絕對位置編碼是一種將序列中的每個位置進行編碼的方法，它為每個位置分配一個唯一的編碼向量。其優勢在於它不依賴於序列中的其他元素，可以獨立地表示每個位置的資訊，比較簡單容易計算。

Transformer 所用的就是絕對位置編碼策略，計算公式如下：

\[\text{PE}(pos,2i)=\sin(pos/10000^{2i/d}) \]

\[\text{PE}(pos,2i+1)=\cos(pos/10000^{2i/d}) \]

其缺點也比較明顯：

絕對位置編碼無法反應不同詞之間的相對關係，例如位置 1 和 2 跟 5 和 500 的差異是一樣的
表示不了比預訓練文字長度更長的位置向量表示，如果預訓練最大長度為 512 的話，那麼最多就只能處理長度為 512 的句子，再長就處理不了了。

相對位置編碼

旋轉位置編碼

【轉知乎回答】一文看懂 LLaMA 中的旋轉式位置編碼（Rotary Position Embedding）
2024-07-19
SciTech-BigDataAIML-LLM-PE(Positional Encoding)位置編碼: Absolute(絕對)Position + Relative(相對)Position + Rotate(旋轉)Position
2024-08-22
AIEncoding
Transformer模型：Position Embedding實現
2024-08-25
ORM模型
[NLP] 相對位置編碼(二) Relative Positional Encodings - Transformer-XL
2019-07-26
EncodingORM
Embedding技術與應用(4): Embedding應用工程探析
2023-11-20
將強化學習引入NLP：原理、技術和程式碼實現
2023-11-15
強化學習
Embedding技術與應用(3)：Embeddings技術的實踐應用
2023-11-08
萬字長文概述NLP中的深度學習技術
2019-02-28
深度學習
[NLP] 知識抽取技術
2024-09-12
psplash進度條旋轉成功
2020-04-05
阿里NLP總監分享-NLP技術的應用與思考
2018-12-09
阿里
設計位置編碼
2024-12-03
箭頭旋轉程式碼
2024-11-10
Flutter 圖片裁剪旋轉翻轉編輯器
2019-09-10
Flutter
Transformer中的位置編碼(Positional Encoding)
2024-10-19
ORMEncoding
技術問 - 進位制轉換
2019-03-07
新媒體編碼時代的技術：編碼與傳輸
2018-10-23
[轉]旋轉矩陣：點旋轉和座標系旋轉
2024-12-10
矩陣
Codidate - 一個先進的線上技術面試平臺
2019-09-13
面試
中國AI技術領先，是因為數學好？美國雜誌直指中美數學教育差距
2020-07-14
AI
學習人工智慧技術，為何先學Python？
2021-12-17
人工智慧Python
IEA報告：先進清潔技術製造業
2024-07-11
CSS-背景位置-x|background-position-x
2018-09-12
CSS
THREE 矩陣優先原則和平移旋轉矩陣
2022-04-18
矩陣
推薦系統 embedding 技術實踐總結
2020-06-30
提升編碼技能的幾種高階技術
2024-03-20
【雜學】大模型推理加速 —— KV-cache 技術
2024-11-13
大模型
NLP 中不同詞嵌入技術的比較 - KDnuggets
2021-11-11
三維座標系旋轉——旋轉矩陣到旋轉角之間的換算
2019-04-23
矩陣
autodesk-forge 模型旋轉程式碼
2020-11-02
模型
百度旋轉驗證碼
2024-08-03
5項先進採購技術，幫助你的企業脫穎而出
2023-10-10
blender python api -修改骨架中特定骨骼的變換，包括沿不同軸的旋轉、位置和縮放(旋轉為四元數運算WXYZ)
2024-04-19
PythonAPI
JIT 編譯後的程式碼儲存位置
2024-12-10
編譯
Prompt learning 教學[進階篇]：簡介Prompt框架並給出nlp技術：Few-Shot Prompting等
2023-05-18
框架
矩陣旋轉-Eigen應用（QTCreator編輯器）
2021-05-13
矩陣QT
NLP第3章中文分詞技術
2018-06-25
中文分詞
谷歌開源 BERT：最先進的 NLP 預訓練技術，支援中文和更多語言
2018-11-07
谷歌

【雜學】先進的 NLP 技術 —— 旋轉位置編碼（Rotary Position Embedding，RoPE）

絕對位置編碼

相對位置編碼

旋轉位置編碼

相關文章