vit中的生成分類識別符號介紹

海_纳百川發表於2024-08-10

原文網址 : https://www.cnblogs.com/chentiao/p/18352837

符號

Vision Transformer (ViT) 分類識別符號

1. 初始化分類識別符號

在ViT中，分類識別符號是一個可學習的向量，通常在模型初始化時隨機初始化。這個識別符號的維度與影像塊的嵌入向量維度相同，通常記作 z_cls，其大小為 D（與每個影像塊的嵌入向量維度一致）。

2. 與影像塊嵌入一起作為輸入

將這個分類識別符號 z_cls 附加在所有影像塊的嵌入向量之前，形成一個擴充套件後的輸入序列。

假設原始影像塊嵌入的序列表示為 [z₁, z₂, …, z_N]，其中 N 是影像塊的數量，那麼完整的輸入序列將是：

[z_cls, z₁, z₂, …, z_N]

這裡，輸入序列的維度為 (N+1) × D。

3. 在Transformer中處理

這個包含分類識別符號的輸入序列會傳遞給Transformer的多層編碼器，經過多層自注意力機制和前饋神經網路的處理。分類識別符號在每一層都會被更新，並最終聚合整個影像的資訊。

4. 提取最終分類識別符號

當輸入序列經過所有Transformer層的處理後，提取出最終的分類識別符號 z_cls^final。

這個分類識別符號是一個綜合了整個影像資訊的嵌入向量。

5. 傳遞給分類頭

最終的分類識別符號 z_cls^final 會被傳遞給一個分類頭（通常是一個全連線層）進行影像的分類任務。分類頭輸出的向量用於預測影像屬於哪個類別。

6. 程式碼示例（假設使用Python和PyTorch）

import torch
import torch.nn as nn

class VisionTransformer(nn.Module):
def __init__(self, num_patches, embed_dim, num_classes):
super(VisionTransformer, self).__init__()
# 初始化分類識別符號 (CLS token)
self.cls_token = nn.Parameter(torch.zeros(1, 1, embed_dim))
self.position_embeddings = nn.Parameter(torch.zeros(1, num_patches + 1, embed_dim))
self.transformer = nn.TransformerEncoder(
nn.TransformerEncoderLayer(embed_dim, nhead=8),
num_layers=12
)
self.classifier = nn.Linear(embed_dim, num_classes)

def forward(self, x):
batch_size = x.size(0)
# 複製分類識別符號，使其適應批處理大小
cls_tokens = self.cls_token.expand(batch_size, -1, -1)
# 將分類識別符號新增到影像塊的嵌入向量之前
x = torch.cat((cls_tokens, x), dim=1)
# 新增位置編碼
x = x + self.position_embeddings
# 輸入Transformer
x = self.transformer(x)
# 提取最終的分類識別符號
cls_token_final = x[:, 0, :]
# 傳遞給分類頭進行分類
out = self.classifier(cls_token_final)
return out

簡單介紹Go 中的空白識別符號下劃線
2022-04-10
Go符號
如何生成分散式唯一時間戳識別符號 - vanillajava
2022-01-15
分散式時間戳符號Java
識別符號
2024-12-05
符號
python的識別符號
2020-12-17
Python符號
linux常見特殊符號介紹
2024-06-20
Linux符號
使用去中心化識別符號 (DID) 作為識別符號元系統
2024-06-04
中心化符號
Android開發 - UUID 類通用唯一識別符號解析
2024-08-24
AndroidUI符號
go——識別符號的命名規範
2024-08-16
Go符號
Java資料型別、識別符號
2023-03-29
Java資料型別符號
Python中的識別符號有哪些基礎原則?
2021-10-12
Python符號
C語言-識別符號命名
2018-11-22
C語言符號
識別符號與關鍵字
2018-07-17
符號
java基本無法-識別符號
2020-12-12
Java符號
C++ 提示未宣告的識別符號
2019-03-01
C++符號
.vue檔案中style標籤的幾個識別符號
2018-07-18
Vue符號
AppID 的英文全稱是 Application Identifier AppID（應用程式識別符號）GUID（全域性唯一識別符號）
2024-03-09
APPIDE符號GUI
python:LEGB識別符號解析順序
2018-09-03
Python符號
SCSS &父選擇器識別符號
2018-09-11
CSS符號
URI（統一資源識別符號）
2020-07-27
符號
字串切片識別符號是什麼
2024-07-12
字串符號
JavaSE 關鍵字和識別符號
2024-05-25
Java符號
1413: C語言合法識別符號
2020-12-04
C語言符號
識別符號的命名規則和規範
2024-03-19
符號
Java的識別符號與編碼規範
2023-01-11
Java符號
關鍵字、資料型別、識別符號
2024-07-06
資料型別符號
package.json 中的版本號，符號 ~ 與 ^ 的區別及其他符號的含義
2024-08-02
PackageJSON符號
Python中合法識別符號需要滿足什麼條件？
2023-02-09
Python符號
JAVA-識別符號、變數、資料型別
2021-03-09
Java符號變數資料型別
js如何生成唯一識別符號UUID
2018-07-17
JS符號UI
C語言合法識別符號 hd 2024
2020-04-06
C語言符號
java:識別符號關鍵字變數
2020-12-17
Java符號變數
＜Python＞識別符號、變數的定義與使用
2020-12-27
Python符號變數
表格識別產品介紹
2019-11-29
Go語言的識別符號、關鍵字、字面量、型別
2019-02-16
Go符號型別
[MySQL] MySQL資料庫中唯一識別符號(ID)的梳理總結
2024-10-18
MySql資料庫符號
Python技術分享：Python中的識別符號有哪些基礎原則？
2021-10-13
Python符號
Java中識別符號、關鍵字、保留字的一些解釋
2021-01-02
Java符號
中安增值稅發票識別+核驗介紹
2019-11-19