超越單詞計數：上下文位置編碼CoPE

banq發表於2024-05-30

原文網址 : https://www.jdon.com/73867.html

語境上下文很重要！ CoPE 是一種新的transformer位置編碼方法，它考慮了 * 上下文 *。

- 可根據需要 "計算 "每個詞頭的距離，例如第 i 個句子或段落、單詞、動詞等。而不僅僅是標記。
- CoPE 解決了標準transformer無法解決的計數和複製任務。
- 在語言建模和編碼任務方面，PPL 更勝一籌。

動機：
即使是功能強大的 LLM：如GPT4 & Llama 2，在按標記token索引時很難注意到句子等概念。

這是架構的根本缺陷。
一個連這都做不到的模型，如何實現 AGI？

CoPE 配方：

- 計算每個查詢、鍵對的門（使用上下文）
- 透過門的累積和計算位置

對每個詞頭都這樣做。
這樣就能對一個概念（如一個句子）進行非常敏銳的關注，而標準 PE 無法做到這一點。

CoPE 可以解決人工計數、選擇性複製和 "Flip-Flop "任務等常用位置編碼無法解決的問題。它在分佈內和分佈外（與訓練相比，在更大或更小的上下文中）都能更好地工作。

最後，CoPE 在標準語言和程式碼建模任務中表現出色，改進了 PPL。

該論文作者是 Meta 的 FAIR 的 Olga Golovneva、Tianlu Wang、Jason Weston 和 Sainbayar Sukhbaatar

以下是該論文的要點摘要：

CoPE 簡介：

作者提出了 CoPE，這是一種新的位置編碼方法，允許模型在確定位置時考慮上下文，從而注意到句子
這與基於 token 計數的傳統位置編碼不同，傳統位置編碼無法推廣到更高的抽象層次，例如關注第 i 個句子。

CoPE 的工作原理：

CoPE 根據 token 的上下文向量計算門值，
並使用這些門值分配位置。

這允許更細緻的注意力機制，例如關注特定的單詞、名詞或句子。

實驗與結果：
進行了一系列實驗來評估 CoPE 在各種任務上的效能，包括 Flip-Flop 語言建模、選擇性複製、計數任務、Wikitext-103 上的語言建模和程式碼建模。

CoPE 的表現優於基於 token 的 PE 方法，尤其是在域外泛化方面。

效率和計算：
討論了 CoPE 的計算效率，並指出它可以以最小的額外計算成本來實現。

CoPE 比傳統的位置編碼方法有了顯著的改進，並且在文字和程式碼之外的各個領域都有潛在的應用。

設計位置編碼
2024-12-03
文字單詞one-hot編碼
2021-01-04
使用map：單詞計數程式
2020-10-27
C++ 統計單詞數
2024-09-10
C++
[LeetCode] Short Encoding of Words 單詞集的短編碼
2018-12-08
LeetCodeEncoding
統計檔案中出現的單詞次數
2018-03-29
Transformer中的位置編碼(Positional Encoding)
2024-10-19
ORMEncoding
python統計英文文字中的迴文單詞數
2020-05-13
Python
JIT 編譯後的程式碼儲存位置
2024-12-10
編譯
Spark-stream基礎---sparkStreaming和Kafka整合wordCount單詞計數
2019-04-12
SparkKafka
zzulioj:1133:單詞個數統計(python)我有點皮！！嘿嘿
2020-12-17
Python
期末大作業關於利用hadoop來統計單詞數目
2020-12-20
Hadoop
C++原始碼單詞掃描程式（詞法分析）
2020-10-16
C++原始碼詞法分析
AOSP 原始碼整編單編
2019-01-02
原始碼
LeetCode-434-字串中的單詞數
2021-10-17
LeetCode字串
【搬磚筆記】利用GeoHash為地理位置編碼
2019-05-12
筆記
transformer的位置編碼具體是如何做的
2024-08-10
ORM
單詞
2024-10-12
呼叫MapReduce對檔案中單詞出現次數進行統計
2020-12-16
Java 實現《編譯原理》簡單詞法分析功能
2019-06-13
Java編譯原理詞法分析
位置變數
2020-11-16
變數
影像壓縮編碼碼matlab實現——常用引數計算
2020-12-24
Matlab
【編碼】切割單詞流並逆向、大小寫反轉輸出-牛客聯合筆試程式設計題（一）-2016.04.08
2019-05-14
筆試程式設計
瓦爾登湖單詞統計+排序
2020-11-15
排序
音視訊編解碼 -- 編碼引數 CRF
2021-10-19
CRF
[NLP] 相對位置編碼(二) Relative Positional Encodings - Transformer-XL
2019-07-26
EncodingORM
單詞拆分
2024-04-25
webpack單詞
2020-12-31
Web
【Codecs系列】硬體編碼器編碼引數分析
2020-11-19
js劃詞翻譯、螢幕取詞，取詞位置獲取（真正解決定位問題）
2021-01-03
JS
11-09字串中的單詞數
2020-11-09
字串
實驗一原型設計--背單詞APP
2024-04-14
原型APP
單詞拼寫糾正-05-2452.力扣距離字典兩次編輯距離以內的單詞
2024-12-09
力扣
敏感詞 v0.19.0 新特性之敏感詞單個編輯，不必重複初始化
2024-09-19
Spark 從零到開發（四）單詞計數的三種環境實現
2018-08-18
Spark
利用python內建函式，快速統計單詞在文字中出現的次數
2021-09-09
Python函式
【編碼】-整數排序-2016.08.10
2019-05-12
排序
python TK庫統計word文件單詞詞頻程式 UI選擇文件
2020-12-27
PythonUI

超越單詞計數：上下文位置編碼CoPE

相關文章