CVPR 2022資料集彙總｜包含目標檢測、多模態等方向

CV技術指南（公眾號）發表於2022-04-18

原文網址 : https://www.cnblogs.com/wxkang/p/16163055.html

前言本文收集彙總了目前CVPR 2022已放出的一些資料集資源。

轉載自極市平臺

歡迎關注公眾號CV技術指南，專注於計算機視覺的技術總結、最新技術跟蹤、經典論文解讀、CV招聘資訊。

M5Product Dataset

論文地址：https://arxiv.org/abs/2109.04275

資料集地址：https://xiaodongsuper.github.io/M5Product_dataset/index.html

M5Product 資料集是一個大規模的多模態預訓練資料集，具有針對電子產品的粗粒度和細粒度註釋。

600 萬個多模態樣本、5k個屬性和2400 萬個值
5 種模式-影像文字表視訊音訊
600 萬個類別註釋，包含6k個類別
廣泛的資料來源（100 萬商戶提供）

Ego4D

論文地址：https://arxiv.org/abs/2110.07058

資料集地址：https://ego4d-data.org/

在全球 74 個地點和 9 個國家/地區收集的大規模、以自我為中心的資料集和基準套件，包含超過 3,670 小時的日常生活活動視訊。使用七種不同的現成頭戴式攝像機捕獲資料：GoPro、Vuzix Blade、Pupil Labs、ZShades、OR-DRO EP6、iVue Rincon 1080 和 Weeview。除了視訊，部分 Ego4D 還提供其他資料模式：3D 掃描、音訊、凝視、立體、多個同步的可穿戴相機和文字敘述。

Daily Multi-Spectral Satellite Dataset

論文連結：https://arxiv.org/pdf/2203.12560.pdf

資料集地址：https://mediatum.ub.tum.de/1650201

DynamicEarthNet 資料集包含每日 Planet Fusion 影像，以及兩年內全球 75 個地區的每月土地覆蓋類別。七個土地覆蓋類別以時間一致的方式手動註釋。還提供了 Sentinel 2 影像。該資料集是第一個大規模的多類和多時態變化檢測基準，我們希望它能促進地球觀測和計算機視覺領域的多時態研究新浪潮。

VCSL (Video Copy Segment Localization) dataset

論文地址：https://arxiv.org/abs/2203.02654

資料集地址：https://github.com/alipay/VCSL/tree/main/data

與現有的受視訊級標註或小規模限制的複製檢測資料集相比，VCSL 不僅具有兩個數量級的片段級標記資料，16 萬個真實視訊副本對包含超過 28 萬個本地複製片段對，而且涵蓋各種視訊類別和廣泛的視訊時長。每個收集的視訊對中的所有複製片段都是手動提取的，並附有精確註釋的開始和結束時間戳。

Rope3D

論文地址：https://arxiv.org/abs/2203.13608

資料集地址：https://thudair.baai.ac.cn/rope

Rope3D目標檢測資料集是首個同時具有影像和點雲3D聯合標註的大規模、多視角的路側資料集，共50009幀影像資料以及對應的2D&3D標註結果。基於該資料集，可以進行路端單目3D檢測任務的研究。

EDS 資料集

資料集地址：https://github.com/DIG-Beihang/PSN

EDS 資料集針對由機器硬體引數引起的難以察覺的域間偏移問題研究，包含了來自 3 臺不同 X 光機器的 14219 張圖片, 其中 10 類物品, 共計 31655 個目標例項，均由專業標註人員進行標註。

FineDiving

論文地址：https://arxiv.org/pdf/2204.03646.pdf

資料集地址：https://github.com/xujinglin/FineDiving

本資料集收集了奧運會、世界盃、世錦賽以及歐錦賽的跳水專案比賽視訊。每個比賽視訊都提供了豐富的內容，包括所有運動員的跳水記錄、不同視角的慢速回放等。

我們構建了一個由語義和時間結構組織的細粒度視訊資料集，其中每個結構都包含兩級註釋。

對於語義結構，動作級標籤描述了運動員的動作型別，步驟級標籤描述了過程中連續步驟的子動作型別，其中每個動作過程中的相鄰步驟屬於不同的子動作型別。子動作型別的組合產生動作型別。在時間結構中，動作級標籤定位運動員執行的完整動作例項的時間邊界。在此註釋過程中，我們丟棄所有不完整的動作例項並過濾掉慢速播放。步驟級標籤是動作過程中連續步驟的起始幀。

PIAA 資料庫

論文地址：https://arxiv.org/abs/2203.16754

資料集地址：https://cv-datasets.institutecv.com/#/data-sets

個性化影像美學評估 (PIAA) 由於其高度主觀性而具有挑戰性。人們的審美取決於多種因素，包括形象特徵和主體性格。現有的 PIAA 資料庫在註釋多樣性方面，特別是在學科方面受到限制，已不能滿足日益增長的 PIAA 研究需求。為了解決這一難題，我們對個性化影像美學進行了迄今為止最全面的主觀研究，並引入了一個新的具有豐富屬性的個性化影像美學資料庫（PARA），該資料庫由 438 個主題的 31,220 張帶有註釋的影像組成。PARA 具有豐富的標註，包括 9 個面向影像的客觀屬性和 4 個面向人的主觀屬性。