【論文系列】之 ---- CLIP

泪水下的笑靥發表於2024-11-11

原文網址 : https://www.cnblogs.com/myleaf/p/18538485

CLIP（Contrastive Language-Image Pre-Training）

從名字顯而易見：語言-影像，預訓練，主要用於學習影像
該模型的核心思想是使用大量影像和文字的配對資料進行預訓練，以學習影像和文字之間的對齊關係
CLIP模型有兩個模態，一個是文字模態，一個是視覺模態，包括兩個主要部分

內容

該模型的核心思想是使用大量影像和文字的配對資料進行預訓練，以學習影像和文字之間的對齊關係。CLIP模型有兩個模態，一個是文字模態，一個是視覺模態，包括兩個主要部分：

Text Encoder：用於將文字轉換為低維向量表示-Embeding。

Image Encoder：用於將影像轉換為類似的向量表示-Embedding。

在預測階段，CLIP模型透過計算文字和影像向量之間的餘弦相似度來生成預測。這種模型特別適用於零樣本學習任務，即模型不需要看到新的影像或文字的訓練示例就能進行預測。CLIP模型在多個領域表現出色，如影像文字檢索、圖文生成等。

CLIP基本的結構構成

對於影像編碼器部分

Image Encoder
主要進行了以下的內容：

注意看裡面的Image Encoder，那麼他是什麼意思呢？我們來看看。。
首先將影像進行分割，以便於進行後續的影像處理操作

對於文字編碼器部分

主要進行文字的訓練過程

【論文系列】之 ---- BERT
2024-11-10
PointNet系列論文解讀
2019-06-03
文字分類論文系列---
2021-01-02
文字分類
論文閱讀-CORA: Adapting CLIP for Open-Vocabulary Detection with Region Prompting and Anchor Pre-Matching
2024-10-30
APT
三篇論文之bigtable
2019-03-12
論文查重之小白都懂
2024-03-17
EasyNLP帶你玩轉CLIP圖文檢索
2022-06-14
乾貨系列——模板之圖論1
2018-11-08
圖論
【論文】軍事理論課程論文
2018-07-16
canvas clip()
2018-08-09
Canvas
軟考論文之論軟體的可靠性設計
2024-10-16
論文
2024-11-30
圖論系列之「讀取圖演算法」
2021-05-22
圖論演算法
軟體論文之論軟體質量保證及其應用
2024-10-18
小白經典CNN論文復現系列（一）：LeNet1989
2020-12-29
CNN
HTTP基礎系列之：一文搞懂URL
2021-10-14
HTTP
推薦系統論文之序列推薦：KERL
2021-05-17
[基礎] CLIP
2024-03-07
clip-cnblog
2024-05-27
Clip模型使用
2024-11-29
模型
圖論系列之「相鄰節點迭代器 ( adjIterato ) 」
2021-05-22
圖論
軟考論文之論企業整合架構設計及其應用
2024-10-18
架構
《率土之濱》首屆遊戲論文大賽圓滿收官，投稿論文超2700篇
2020-06-17
遊戲
『論文精讀』Vision Transformer(VIT)論文解讀
2024-04-25
ORM
[論文翻譯] 分散式訓練 Parameter sharding 之 ZeRO
2022-01-11
分散式
[原始碼解析] PyTorch 分散式(8) -------- DistributedDataParallel之論文篇
2021-11-21
原始碼PyTorch分散式Parallel
INTERSPEECH2020 語音情感分析論文之我見
2021-04-01
【小白寫論文】技術性論文結構剖析
2020-08-23
CSS clip-path
2019-04-17
CSS
CSS3 clip
2018-08-23
CSSS3
CSS background-clip
2019-11-21
CSS
css: clip淺析
2020-01-03
CSS
論文專題
2024-04-08
論文筆記
2024-03-10
筆記
論文記錄
2024-03-05
如何讀論文
2024-05-02
論文學習
2020-06-01
畢設論文
2020-09-23

【論文系列】之 ---- CLIP

CLIP（Contrastive Language-Image Pre-Training）

內容

CLIP基本的結構構成

對於影像編碼器部分

對於文字編碼器部分

相關文章