Block Transformer：透過全域性到區域性的語言建模加速LLM推理

deephub發表於2024-06-08

原文網址 : https://www.cnblogs.com/deephub/p/18238352

在基於transformer的自迴歸語言模型（LMs）中，生成令牌的成本很高，這是因為自注意力機制需要關注所有之前的令牌，通常透過在自迴歸解碼過程中快取所有令牌的鍵值（KV）狀態來解決這個問題。但是，載入所有先前令牌的KV狀態以計算自注意力分數則佔據了LMs的推理的大部分成本。

在這篇論文中，作者提出了Block Transformer架構，該架構透過在較低層次之間的粗糙塊（每個塊代表多個令牌）的自注意力來模擬全域性依賴性，並在較高層次的每個區域性塊內解碼細粒度的令牌，如下圖所示。

論文的主要貢獻包括：

發現了在自迴歸變換器中，全域性和區域性建模在推理時的核心作用和好處，特別是區域性模組的重要性。
利用這些見解可以最佳化架構中的推理吞吐量，與普通transformers相比，顯著提高了效能與吞吐量

https://avoid.overfit.cn/post/6867c4c1e9f24d3fb5fef2cd2ecfd989

全域性變數與區域性變數
2019-10-21
變數
區域性變數和全域性變數
2024-11-13
變數
python學習筆記區域性和全域性作用域
2019-03-20
Python筆記
javascript中的作用域（全域性變數和區域性變數）
2018-05-22
JavaScript變數
Java區域性變數與全域性變數
2018-12-21
Java變數
java 全域性變數和區域性變數
2018-07-27
Java變數
jmeter全域性變數和區域性變數
2024-04-02
JMeter變數
Tomcat全域性/區域性https訪問配置方法
2020-04-08
TomcatHTTP
【c】全域性變數與區域性變數
2024-08-20
變數
vue.js全域性元件和區域性元件區別
2020-07-26
Vue.js元件
C語言--靜態區域性變數
2020-10-05
C語言變數
Python中的全域性變數和區域性變數
2018-10-05
Python變數
js-js的全域性變數和區域性變數
2018-11-01
JS變數
LLM 推理最佳化探微 (1) ：Transformer 解碼器的推理過程詳解
2024-01-31
ORM
uni-app全域性樣式和區域性樣式
2023-12-07
APP
區域性代理ip與全域性代理ip怎麼用？
2021-09-11
JavaScript五：全域性變數&區域性變數；運算子
2020-12-27
JavaScript變數
直播平臺原始碼，將全域性的ArrayList 生成區域性的ArrayList
2023-03-29
原始碼
【UniApp】-uni-app-全域性資料和區域性資料
2023-12-08
APP
webpack全域性和區域性安裝、解除安裝和執行
2018-09-19
Web
區域性變數和全域性變數（靜態和非靜態）區別
2020-10-27
變數
Vue入門指南-02自定義全域性和區域性指令 (快速上手vue)
2019-03-16
Vue
duxapp放棄了redux，在duxapp中區域性、全域性狀態的實現方案
2024-11-07
APPRedux
Solidity語言學習筆記————5、全域性變數
2018-06-22
Solid筆記變數
海外HTTP代理中全域性代理和區域性代理是什麼？有什麼區別？
2022-08-29
HTTP
matlab最優化問題的函式(fminbnd),fmincon,globalsearch,multistart（全域性區域性最優）
2018-12-04
Matlab優化函式
NeurIPS 2024｜SparseLLM：突破性全域性剪枝技術，大語言模型稀疏化革命
2024-10-10
模型
函式之定義及全域性變數&區域性變數&風溼理論
2024-06-25
函式變數
win10系統下透過區域語言對語音功能進行設定的方法
2020-03-09
Win10
JavaScript全域性作用域下，變數加var和不加var的區別。
2018-07-17
JavaScript變數
C語言：如何給全域性變數起一個別名？
2022-06-12
C語言變數
主節點，節點編號node_rank，全域性程序編號rank，區域性程序編號，全域性總程序數world_size
2024-12-08
彙編眼中的函式呼叫引數傳遞以及全域性與區域性變數與“基址”
2020-02-04
函式變數
多執行緒中，區域性變數與全域性變數哪個比較安全？
2018-11-18
執行緒變數
區域性性原理——各類優化的基石
2019-08-05
優化
程式效能優化-區域性性原理
2019-01-17
優化
.Net MVC中定義全域性過濾器及在Action中排除全域性過濾器
2018-07-19
MVC過濾器
十二、變數作用域：區域性變數、全域性變數，函式版名片管理系統—新增函式文件
2018-07-23
變數函式

Block Transformer：透過全域性到區域性的語言建模加速LLM推理

相關文章