MAR：針對動作識別的影片掩碼建模

出品人：Towhee 技術團隊王翔宇、顧夢佳

影片識別的標準方法通常會對完整的影片輸入進行操作，這往往會由於影片中廣泛存在的時空冗餘導致效率低下。影片掩碼建模（即 VideoMAE）的最新進展表明，普通視覺 Transformer (ViT) 能夠在僅給定有限視覺內容的情況下補充時空上下文。受此啟發，掩碼動作識別（MAR）提出丟棄一部分 patch 並僅對部分影片進行操作，以此減少冗餘計算。相比 ViT 模型，MAR 能夠在大量降低計算成本的同時，還能始終展現出顯著的效能優勢。尤其是由 MAR 訓練的 ViT-Large，在動作識別資料集 Kinetics-400 和 Something-Something v2 上均具有令人信服的優勢。

Overview of Masked Action Recognition (MAR).

MAR 包含以下兩個不可或缺的元件：cell running masking 和 bridging classifier。具體來說，為了使 ViT 能夠輕鬆感知可見 patch 之外的細節，cell running masking 保留了影片中的時空相關性。它能夠確保可以依次觀察相同空間位置的 patch，以便於重建。此外，雖然部分觀察到的特徵可以重建語義顯式的不可見 patch，但它們無法實現準確的分類。為此，bridging classifier 被用來彌合用於重建的 ViT 編碼特徵與專門用於分類的特徵之間的語義鴻溝。

相關資料：
程式碼地址：https://github.com/alibaba-mmai-research/Masked-Action-Recognition
論文連結：MAR: Masked Autoencoders for Efficient Action Recognition

SimMIM：更簡單的掩碼影像建模
2023-01-31
詳解影片中動作識別模型與程式碼實踐
2022-12-14
模型
針對自動駕駛中交通燈識別的對抗性鐳射攻擊
2022-03-09
自動駕駛
如何製作掩碼圖
2020-12-30
YOLOV5 模型和程式碼修改——針對小目標識別
2022-04-26
YOLO模型
【NeurIPS 2022】影片動作識別，AFNet 用更低的成本接收更多資料
2023-02-24
運動瘦身動作識別APP開發
2023-04-25
APP
短影片app原始碼，圖形和簡訊驗證碼的自動識別獲取
2023-11-17
APP原始碼
如何理解掩碼、反掩碼、萬用字元
2020-12-14
字元
子網掩碼和網路ip的相關知識
2019-03-12
網路知識之 IP 與子網掩碼
2019-10-28
Action Recognition——基於表示的動作識別綜述
2018-12-12
影片直播app原始碼，傳送驗證碼驗證碼識別
2023-10-11
APP原始碼
人臉識別與人體動作識別技術及應用pdf
2018-08-23
RAG知識庫之針對長文件的Raptor索引
2024-08-05
APT索引
企業品牌設計,年會影片製作,卡通形象建模
2019-12-23
短視訊直播原始碼，自動對上傳的圖片進行識別
2022-02-24
原始碼
手動計運算元網掩碼的 IP 範圍
2024-06-07
抖音自動識別影片標題描述進行點贊評論指令碼2024.11.22
2024-11-22
指令碼
Action Recognition——基於深度學習的動作識別綜述
2018-12-12
深度學習
影片監控智慧影像識別
2024-09-04
BIM自動識別三維地圖-Revit模型自動識別三維地圖-IFC模型自動識別三維地圖製作
2022-04-14
地圖模型
阿里巴巴論文提出針對影視作品的語音情感識別資訊融合框架
2018-04-10
阿里框架
Docker 映象製作教程：針對不同語言的精簡策略
2021-12-21
Docker
【ECCV 2022】TeSTRa：穩定的流式影片識別
2023-02-27
針對ShotGun的ServerRewind
2024-08-20
OTGServer
圖卷積在基於骨架的動作識別中的應用
2019-05-28
卷積
win10如何更改子網掩碼_win10更改子網掩碼的方法
2020-05-26
Win10
全面詳解！圖卷積在動作識別方向的應用
2020-01-15
卷積
Win10設定在播放影片時針對影片進行最佳化方法
2020-10-24
Win10
堅決反制|美國安全域性針對中國機構又有大動作
2022-06-29
影片智慧識別安全帽佩戴
2024-09-16
使用GSAP製作動畫影片
2024-07-15
動畫
Solaris10怎麼更改子網掩碼？Solaris10更改子網掩碼的方法
2020-07-11
針對neumann邊界條件的差分法程式碼
2020-10-11
Goalng 子網掩碼地址
2019-09-25
Go
全面詳解！圖卷積在動作識別方向的應用（下）
2020-01-03
卷積
全面詳解！圖卷積在動作識別方向的應用（上）
2020-01-03
卷積

MAR：針對動作識別的影片掩碼建模

相關文章