MixMIM 建立混合影像，提出新型掩碼方案

出品人：Towhee 技術團隊顧夢佳

商湯和港中文聯合提出一種簡單但有效的掩碼影像建模（MIM）方法 MixMIM，透過建立混合影像利用BEiT和MAE的優點，又避免了它們的侷限性。MixMIM 可以有效地學習高質量的視覺表示，也能被廣泛應用於預訓練的層次化視覺 Transformer，比如 Swin Transformer、PVT 等。MixMIM 還探索了輕量級架構，將 Swin Transformer 修改為預訓練和知識遷移的編碼器。由於層次結構，MixMIM 適用於各種下游任務，比如影像分類、目標檢測、語義分割任務。實驗結果表明，在模型尺寸和 FLOPs 相似的情況下，MixMIM 在廣泛的下游任務上始終優於 BEiT 和 MAE，包括公開影像資料集 ImageNet、iNaturalist 和 Places上的影像分類，COCO上的目標檢測和例項分割，以及 ADE20K 上的語義分割。

Overview of MixMIM

給定訓練集中的兩幅隨機影像，MixMIM 使用隨機混合掩碼建立一幅混合影像作為輸入。模型會訓練一個層次化 ViT 來重建兩幅原始影像，用於學習視覺表示。不同於傳統方法中用特殊的掩碼符號替換輸入影像的掩碼 token，MixMIM 選擇用另一個影像的視覺 token 替換掩碼 token。另外，MixMIM 依然採用了編碼器-解碼器的結構設計。編碼器處理混合影像以獲得兩個部分掩蔽影像的隱藏表示，而解碼器則用於重建兩個原始影像。

新型掩碼自編碼器 AdaMAE，自適應取樣
2023-02-22
SimMIM：更簡單的掩碼影像建模
2023-01-31
如何理解掩碼、反掩碼、萬用字元
2020-12-14
字元
從影像中檢測和識別表格，北航&微軟提出新型資料集TableBank
2019-03-21
微軟
Adobe提出新型超解析度方法：用神經網路遷移參照影像紋理
2019-03-16
神經網路
Google 提出了一種新型的文字生成模型 LaserTagger
2020-02-23
Go模型
Goalng 子網掩碼地址
2019-09-25
Go
如何製作掩碼圖
2020-12-30
子網掩碼如何計算
2019-06-18
win10如何更改子網掩碼_win10更改子網掩碼的方法
2020-05-26
Win10
Solaris10怎麼更改子網掩碼？Solaris10更改子網掩碼的方法
2020-07-11
Linux之程序掩碼umask詳解。
2024-03-15
Linux
UC Berkeley提出新型分散式執行框架Ray：有望取代Spark
2019-02-24
分散式框架Spark
win10看子網掩碼怎麼操作_win10如何檢視子網掩碼
2020-05-06
Win10
低程式碼開發平臺新型企業中臺解決方案
2023-05-11
如何建立更好的混合雲平臺
2018-05-21
無問芯穹提出混合稀疏注意力方案MoA，加速長文字生成，實現最高8倍吞吐率提升
2024-11-08
匹配子網掩碼正規表示式
2020-02-10
語言分割偽彩色掩碼詳解
2024-05-25
C++之OpenCV入門到提高006：影像混合
2024-12-06
C++OpenCV
Groovy + Java 混合程式設計方案：GMaven
2022-11-24
Java程式設計Maven
常用的畫素操作演算法：影像加法、畫素混合、提取影像中的ROI
2019-01-19
演算法
聯合辦公室出租，新型解決方案
2022-01-27
網路知識之 IP 與子網掩碼
2019-10-28
Dore 混合應用框架 —— 基於 React Native 的混合應用遷移方案
2019-02-28
框架React Native
混合專家更有主見了，能感知多模態分情況行事，Meta提出模態感知型專家混合
2024-08-11
AzureStack混合雲大資料解決方案
2018-05-10
REST大資料
Python武器庫 - 科研中常用的python影像操作 - 建立純色影像
2024-07-01
Python
OpenCV計算機視覺學習（2）——影像算術運算 & 掩膜mask操作（數值計算，影像融合，邊界填充）
2020-10-08
OpenCV計算機視覺
科研人員提出可加速AI的計算與儲存器混合技術
2018-05-07
AI
Google提出移動端新SOTA模型MixNets：用混合深度卷積核提升精度
2019-12-19
Go模型卷積
excel混合文字提取數字公式 excel怎麼把數字單獨提出來
2022-04-07
Excel公式
Android平臺影像壓縮方案
2019-03-03
Android
ip子網掩碼計算及子網劃分
2020-09-24
目的網路、子網掩碼、下一跳例子
2020-11-07
MAR：針對動作識別的影片掩碼建模
2023-02-28
阿里提出結構保持的AI視覺演算法：顯著提升HDR影像轉LDR影像質量
2024-09-23
阿里AI視覺演算法
基於 Rainbond 的混合雲管理解決方案
2023-05-04
AI

MixMIM 建立混合影像，提出新型掩碼方案

相關文章