目標檢測兩種常用的資料集COCO和VOC

Tutu007發表於2024-03-06

背景:

今天跟著我們演算法工程師學了幾分鐘的演算法模型訓練,她講到目標檢測常用的資料集是COCO和VOC,我不知道啥是資料集,更加不知道這兩個是什麼,它們有什麼用,於是我簡單瞭解了一下子~

要解決的問題:

  • 什麼是資料集?
  • COCO和VOC是什麼?
  • 它們分別是什麼格式?

問題1:什麼是資料集?

  • 資料集,其字面意思,就是由資料組成的集合。
  • 資料集通常包含了用來訓練和驗證模型的樣本資料,這些資料可以是數字、文字、影像、音訊或影片等形式的資料。
  • 資料集用於訓練演算法模型,使模型能夠學習到資料中的模式和規律。
  • 資料集通常被劃分為訓練集、驗證集和測試集三個子集。
  • 訓練集用於訓練機器學習模型,驗證集用於選擇和調整模型的超引數和結構,測試集用於評估模型的效能和準確度。

問題2:COCO和VOC是什麼?

  • VOC資料集指的是Visual Object Classes資料集,是一個用於目標檢測和影像分割任務的常用資料集之一。這個資料集最初由英國牛津大學的計算機視覺小組建立,旨在幫助研究人員開發和評估目標檢測和影像分割演算法。VOC資料集中包含20種常見的物體類別,例如人、車、狗、貓等。關於為什麼叫VOC,可能是因為其最初目的是識別和分類視覺物件(Visual Object Classes)。

  • COCO資料集是指Common Objects in Context資料集,是一個用於目標檢測、影像分割和影像標註任務的知名資料集。COCO資料集由微軟研究院建立,旨在提供更廣泛的物體類別和更豐富的場景上下文,以促進計算機視覺領域的研究。

    關於為什麼叫COCO,據說是因為該資料集的目標是識別和理解“在上下文中的常見物體”(Common Objects in Context),因此得名COCO。這個資料集包含了80個不同的物體類別,如人、車、飛機、動物等,以及大量的影像和對應的註釋資訊,被廣泛應用於目標檢測、影像分割和影像標註等任務的評估和研究。

問題3:它們分別是什麼格式?

  • VOC資料集的標註格式是XML。每個影像對應一個XML檔案。
  • COCO資料集的標註格式是JSON或txt。所有的目標框標註都在同一個JSON或txt裡。

參考資料:

什麼是資料集? https://blog.csdn.net/weixin_52093896/article/details/130070130

目標檢測任務中常用的資料集格式(voc、coco、yolo) https://blog.csdn.net/weixin_45277161/article/details/130331788

目標檢測資料集PASCAL VOC詳解https://zhuanlan.zhihu.com/p/362044555

相關文章