目標檢測兩種常用的資料集COCO和VOC

Tutu007發表於2024-03-06

原文網址 : https://www.cnblogs.com/tully/p/18057834

背景：

今天跟著我們演算法工程師學了幾分鐘的演算法模型訓練，她講到目標檢測常用的資料集是COCO和VOC，我不知道啥是資料集，更加不知道這兩個是什麼，它們有什麼用，於是我簡單瞭解了一下子~

要解決的問題：

什麼是資料集？
COCO和VOC是什麼？
它們分別是什麼格式？

問題1：什麼是資料集？

資料集，其字面意思，就是由資料組成的集合。
資料集通常包含了用來訓練和驗證模型的樣本資料，這些資料可以是數字、文字、影像、音訊或影片等形式的資料。
資料集用於訓練演算法模型，使模型能夠學習到資料中的模式和規律。
資料集通常被劃分為訓練集、驗證集和測試集三個子集。
訓練集用於訓練機器學習模型，驗證集用於選擇和調整模型的超引數和結構，測試集用於評估模型的效能和準確度。

問題2：COCO和VOC是什麼？

VOC資料集指的是Visual Object Classes資料集，是一個用於目標檢測和影像分割任務的常用資料集之一。這個資料集最初由英國牛津大學的計算機視覺小組建立，旨在幫助研究人員開發和評估目標檢測和影像分割演算法。VOC資料集中包含20種常見的物體類別，例如人、車、狗、貓等。關於為什麼叫VOC，可能是因為其最初目的是識別和分類視覺物件（Visual Object Classes）。

COCO資料集是指Common Objects in Context資料集，是一個用於目標檢測、影像分割和影像標註任務的知名資料集。COCO資料集由微軟研究院建立，旨在提供更廣泛的物體類別和更豐富的場景上下文，以促進計算機視覺領域的研究。

關於為什麼叫COCO，據說是因為該資料集的目標是識別和理解“在上下文中的常見物體”（Common Objects in Context），因此得名COCO。這個資料集包含了80個不同的物體類別，如人、車、飛機、動物等，以及大量的影像和對應的註釋資訊，被廣泛應用於目標檢測、影像分割和影像標註等任務的評估和研究。

問題3：它們分別是什麼格式？

VOC資料集的標註格式是XML。每個影像對應一個XML檔案。
COCO資料集的標註格式是JSON或txt。所有的目標框標註都在同一個JSON或txt裡。

參考資料：

什麼是資料集？ https://blog.csdn.net/weixin_52093896/article/details/130070130

目標檢測任務中常用的資料集格式(voc、coco、yolo) https://blog.csdn.net/weixin_45277161/article/details/130331788

目標檢測資料集PASCAL VOC詳解https://zhuanlan.zhihu.com/p/362044555

【轉載備份】目標檢測兩種常用的資料集COCO和VOC
2024-06-23
voc資料集轉換成coco資料集
2024-04-27
目標檢測資料集分析
2022-04-19
【YOLO目標檢測實戰】3.使用YOLO11訓練COCO128資料集
2024-11-06
YOLO
SAR目標檢測資料集彙總
2024-03-23
目標檢測資料集，全部有標註
2024-04-07
目標檢測 YOLO v3 驗證 COCO 模型
2019-03-04
YOLO模型
coco資料集詳解
2024-06-11
目標檢測（4）：LeNet-5 的 PyTorch 復現（自定義資料集篇）！
2022-01-07
PyTorch
目標檢測
2018-04-24
COCO資料集格式互換
2018-11-09
CVPR 2022資料集彙總｜包含目標檢測、多模態等方向
2022-04-18
目標檢測（3）：LeNet-5 的 PyTorch 復現（CIFAR10 資料集篇）！
2021-12-28
PyTorch
目標檢測（2）：LeNet-5 的 PyTorch 復現（MNIST 手寫資料集篇）
2021-12-17
PyTorch
目標檢測（3）：LeNet-5 的 PyTorch 復現（CIFAR10 資料集篇）
2021-12-28
PyTorch
不帶Anchors和NMS的目標檢測
2021-07-11
2018目標檢測
2018-08-27
九、目標檢測
2024-10-03
基於pytorch的目標檢測資料增強（tensor資料流版本）
2021-02-03
PyTorch
目標檢測---教你利用yolov5訓練自己的目標檢測模型
2022-06-14
YOLO模型
使用coco資料集建立賦值黏貼篡改資料集
2021-01-01
賦值
python將目標檢測資料匯入到指定資料庫中
2020-12-29
Python資料庫
目標檢測之SSD
2018-12-18
目標檢測之RetinaNet
2018-12-19
NaN
目標檢測面面觀
2018-09-04
28-目標檢測
2024-08-27
目標檢測綜述
2020-12-13
2019 年的目標檢測指南
2019-08-14
目標檢測：二維碼檢測方案
2022-03-26
1460萬個目標檢測邊界框：谷歌開源Open Images V4資料集
2018-11-13
谷歌
Google開放最大目標檢測資料集，還要為它舉辦AI挑戰賽
2018-05-01
GoAI
目標檢測之YOLO系列
2018-12-18
YOLO
【目標檢測】Bounding Box Regression
2019-02-25
目標檢測發展方向
2018-08-09
SSD 目標檢測 Keras 版
2019-02-19
Keras
【目標檢測】R-CNN
2020-12-13
CNN
奪冠PASCAL VOC視覺大賽，創新奇智團隊提出目標檢測新演算法
2019-07-04
視覺演算法
影象處理入門：目標檢測和影象檢索綜述
2018-07-17