CVPR 2022資料集彙總|包含目標檢測、多模態等方向

CV技術指南(公眾號)發表於2022-04-18
前言 本文收集彙總了目前CVPR 2022已放出的一些資料集資源。

轉載自極市平臺

歡迎關注公眾號CV技術指南,專注於計算機視覺的技術總結、最新技術跟蹤、經典論文解讀、CV招聘資訊。

M5Product Dataset

論文地址:https://arxiv.org/abs/2109.04275

資料集地址:https://xiaodongsuper.github.io/M5Product_dataset/index.html

M5Product 資料集是一個大規模的多模態預訓練資料集,具有針對電子產品的粗粒度和細粒度註釋。

  • 600 萬個多模態樣本、5k個屬性和2400 萬個值
  • 5 種模式-影像 文字 表 視訊 音訊
  • 600 萬個類別註釋,包含6k個類別
  • 廣泛的資料來源(100 萬商戶提供)
CVPR 2022資料集彙總|包含目標檢測、多模態等方向

Ego4D

論文地址:https://arxiv.org/abs/2110.07058

資料集地址:https://ego4d-data.org/

在全球 74 個地點和 9 個國家/地區收集的大規模、以自我為中心的資料集和基準套件,包含超過 3,670 小時的日常生活活動視訊。使用七種不同的現成頭戴式攝像機捕獲資料:GoPro、Vuzix Blade、Pupil Labs、ZShades、OR-DRO EP6、iVue Rincon 1080 和 Weeview。除了視訊,部分 Ego4D 還提供其他資料模式:3D 掃描、音訊、凝視、立體、多個同步的可穿戴相機和文字敘述。

CVPR 2022資料集彙總|包含目標檢測、多模態等方向

 

Daily Multi-Spectral Satellite Dataset

論文連結:https://arxiv.org/pdf/2203.12560.pdf

資料集地址:https://mediatum.ub.tum.de/1650201

DynamicEarthNet 資料集包含每日 Planet Fusion 影像,以及兩年內全球 75 個地區的每月土地覆蓋類別。七個土地覆蓋類別以時間一致的方式手動註釋。還提供了 Sentinel 2 影像。該資料集是第一個大規模的多類和多時態變化檢測基準,我們希望它能促進地球觀測和計算機視覺領域的多時態研究新浪潮。

CVPR 2022資料集彙總|包含目標檢測、多模態等方向

 

VCSL (Video Copy Segment Localization) dataset

論文地址:https://arxiv.org/abs/2203.02654

資料集地址:https://github.com/alipay/VCSL/tree/main/data

與現有的受視訊級標註或小規模限制的複製檢測資料集相比,VCSL 不僅具有兩個數量級的片段級標記資料,16 萬個真實視訊副本對包含超過 28 萬個本地複製片段對,而且涵蓋各種視訊類別和廣泛的視訊時長。每個收集的視訊對中的所有複製片段都是手動提取的,並附有精確註釋的開始和結束時間戳。

CVPR 2022資料集彙總|包含目標檢測、多模態等方向

Rope3D

論文地址:https://arxiv.org/abs/2203.13608

資料集地址:https://thudair.baai.ac.cn/rope

Rope3D目標檢測資料集是首個同時具有影像和點雲3D聯合標註的大規模、多視角的路側資料集,共50009幀影像資料以及對應的2D&3D標註結果。基於該資料集,可以進行路端單目3D檢測任務的研究。

CVPR 2022資料集彙總|包含目標檢測、多模態等方向

 

EDS 資料集

資料集地址:https://github.com/DIG-Beihang/PSN

EDS 資料集針對由機器硬體引數引起的難以察覺的域間偏移問題研究,包含了來自 3 臺不同 X 光機器的 14219 張圖片, 其中 10 類物品, 共計 31655 個目標例項,均由專業標註人員進行標註。

 

FineDiving

論文地址:https://arxiv.org/pdf/2204.03646.pdf

資料集地址:https://github.com/xujinglin/FineDiving

本資料集收集了奧運會、世界盃、世錦賽以及歐錦賽的跳水專案比賽視訊。每個比賽視訊都提供了豐富的內容,包括所有運動員的跳水記錄、不同視角的慢速回放等。

我們構建了一個由語義和時間結構組織的細粒度視訊資料集,其中每個結構都包含兩級註釋。

對於語義結構,動作級標籤描述了運動員的動作型別,步驟級標籤描述了過程中連續步驟的子動作型別,其中每個動作過程中的相鄰步驟屬於不同的子動作型別。子動作型別的組合產生動作型別。在時間結構中,動作級標籤定位運動員執行的完整動作例項的時間邊界。在此註釋過程中,我們丟棄所有不完整的動作例項並過濾掉慢速播放。步驟級標籤是動作過程中連續步驟的起始幀。

CVPR 2022資料集彙總|包含目標檢測、多模態等方向

 

PIAA 資料庫

論文地址:https://arxiv.org/abs/2203.16754

資料集地址:https://cv-datasets.institutecv.com/#/data-sets

個性化影像美學評估 (PIAA) 由於其高度主觀性而具有挑戰性。人們的審美取決於多種因素,包括形象特徵和主體性格。現有的 PIAA 資料庫在註釋多樣性方面,特別是在學科方面受到限制,已不能滿足日益增長的 PIAA 研究需求。為了解決這一難題,我們對個性化影像美學進行了迄今為止最全面的主觀研究,並引入了一個新的具有豐富屬性的個性化影像美學資料庫(PARA),該資料庫由 438 個主題的 31,220 張帶有註釋的影像組成。PARA 具有豐富的標註,包括 9 個面向影像的客觀屬性和 4 個面向人的主觀屬性。

CVPR 2022資料集彙總|包含目標檢測、多模態等方向

歡迎關注公眾號CV技術指南,專注於計算機視覺的技術總結、最新技術跟蹤、經典論文解讀、CV招聘資訊。

CV技術指南建立了一個免費的知識星球。關注公眾號新增編輯的微訊號可邀請加入。

其它文章

Attention Mechanism in Computer Vision

從零搭建Pytorch模型教程(三)搭建Transformer網路

從零搭建Pytorch模型教程(二)搭建網路

從零搭建Pytorch模型教程(一)資料讀取

YOLO系列梳理與複習(二)YOLOv4

YOLO系列梳理(一)YOLOv1-YOLOv3

StyleGAN大彙總 | 全面瞭解SOTA方法、架構新進展

一份熱力圖視覺化程式碼使用教程

一份視覺化特徵圖的程式碼

工業影像異常檢測研究總結(2019-2020)

小樣本學習研究綜述(中科院計算所)

目標檢測中正負樣本區分策略和平衡策略總結

目標檢測中的框位置優化總結

目標檢測、例項分割、多目標跟蹤的Anchor-free應用方法總結

Soft Sampling:探索更有效的取樣策略

如何解決工業缺陷檢測小樣本問題

關於快速學習一項新技術或新領域的一些個人思維習慣與思想總結

 

相關文章