注意力機制

想你时风起發表於2024-04-07

原文網址 : https://www.cnblogs.com/wephilos/p/18119960

注意力機制

有一個字典(Python中稱為字典，也叫鍵值對)。我們記為(key, value)。

比方說我們有下列腰圍體重資料，我們又有一個樣本，他的腰圍是57，那麼我們預測他的體重值是多少呢？或者說我們怎麼預測他的體重值呢？

由於57到56和58的距離一樣，那麼我們可以預測他的體重值為它們對應體重的平均值，即(43 + 48) / 2 = 0.5 * 43 + 0.5 * 48 = 45.5，注意此處，由於56和58離57非常接近，所以我們自然會非常"注意"它們，所以我們分給它們的注意力權重各為0.5。但是這裡有一個問題，我們沒有用上其他的鍵值對

我們好像要調整一下注意力權重，那麼我們該怎麼計算權重呢？

簡單理解，體重預測值f(q)就是預測值的key與每個已知值的key所計算出來的權重再乘以與已知值相對應的value再進行求和。

而其中的權重就是α(q, k_i)

我們將上面的q稱為請求(query)，k叫做鍵(key)，v叫做值(value)。

q，k，v在多維的情況下也是類似的。

假設q是二維的，由於q1和k1都是二維向量，注意力分數可以使以下幾種，如圖所示：

以點積模型為例：

為了方便，我們使用矩陣來表示：

為了緩解梯度消失問題，我們還會除以一個特徵維度，我們將其稱為“縮放點積注意力模型”

如果Q、K、V是同一個矩陣會發生什麼？那就是自注意力，

我麼用X來表示這個矩陣，那麼有：

三個可以訓練的矩陣：

寫在最後

以上截圖和文字均來自於嗶哩嗶哩:

【注意力機制的本質|Self-Attention|Transformer|QKV矩陣-嗶哩嗶哩】 https://b23.tv/W4FwAY4

相關文章

通俗理解自注意力機制和多頭注意力機制
2024-12-09
什麼是注意力機制？
2024-04-07
attention注意力機制學習
2020-11-06
淺析注意力(Attention)機制
2024-11-17
8.1 Attention（注意力機制）和Transformer
2020-01-08
ORM
深入理解圖注意力機制
2019-02-19
為什麼使用自注意力機制？
2018-09-17
umich cv-6-2 注意力機制
2023-10-31
計算機視覺中的注意力機制
2019-02-15
計算機視覺
哈佛大學提出變分注意力：用VAE重建注意力機制
2018-07-26
目標檢測中的注意力機制
2018-12-03
注意力機制----RNN中的self-attention
2020-11-08
RNN
多頭注意力機制的python實現
2024-07-09
Python
Sigmoid注意力一樣強，蘋果開始重新審視注意力機制
2024-09-18
Sigmoid蘋果
深度學習中的注意力機制(Attention Model)
2018-11-05
深度學習
自注意力機制(2)-多頭自注意層
2024-09-23
注意力機制在圖卷積中的應用
2019-04-15
卷積
【機器學習】李宏毅——自注意力機制(Self-attention)
2022-12-16
機器學習
三種Transformer模型中的注意力機制介紹及Pytorch實現：從自注意力到因果自注意力
2024-10-13
ORM模型PyTorch
深入理解BERT Transformer ，不僅僅是注意力機制
2019-03-19
ORM
RNN-Encoder Decoder架構中引入的注意力機制
2018-06-15
RNN架構
自適應注意力機制在Image Caption中的應用
2018-05-10
APT
Deep Reading | 從0到1再讀注意力機制，此文必收藏！
2019-03-11
解碼注意力Attention機制：從技術解析到PyTorch實戰
2023-11-01
PyTorch
注意力機制目前有什麼缺點和改進空間？
2020-08-04
李沐大佬-動手學深度學習筆記-注意力機制
2024-11-19
深度學習筆記
Falcon Mamba: 首個高效的無注意力機制 7B 模型
2024-09-05
模型
CAP：多重注意力機制，有趣的細粒度分類方案 | AAAI 2021
2022-06-24
AI
深度學習教程 | Seq2Seq序列模型和注意力機制
2022-04-14
深度學習模型
NLP教程(6) - 神經機器翻譯、seq2seq與注意力機制
2022-05-10
解讀注意力機制原理，教你使用Python實現深度學習模型
2024-05-27
Python深度學習模型
Seq2Seq那些事：詳解深度學習中的“注意力機制”
2019-01-22
深度學習
從各種注意力機制窺探深度學習在NLP中的神威
2018-10-08
深度學習
帶自注意力機制的生成對抗網路，實現效果怎樣？
2018-06-06
注意力機制下的啟用函式：自適應引數化ReLU
2020-02-29
函式
Google新作：注意力機制是否真的能夠提供模型的可解釋性？
2020-12-03
Go模型
「AI不惑境」計算機視覺中注意力機制原理及其模型發展和應用
2019-08-01
AI計算機視覺模型
基於注意力機制與改進TF-IDF的推薦演算法
2024-04-11
演算法