計算機視覺中的影像標註工具總結

CV技術指南(公眾號)發表於2021-09-19

 本文來自公眾號CV技術指南資源分享系列

建立高質量的資料集是任何機器學習專案的關鍵部分。在實踐中,這通常比實際訓練和超引數優化花費的時間更長。因此,選擇合適的標註工具至關重要。在這裡,我們總結了一些用於計算機視覺任務的最佳影像標註工具:labelme、labelImg、CVAT和hasty.ai。

 

作者:Dmitrii

編譯:CV技術指南

歡迎關注公眾號CV技術指南,專注於計算機視覺的技術總結、最新技術跟蹤、經典論文解讀

 

labelme

地址:https://github.com/wkentaro/labelme

計算機視覺中的影像標註工具總結

你可以用它做什麼

labelme 是一個基於 python 的開源影像多邊形標註工具,可用於手動標註影像以進行物件檢測、分割和分類。它是線上 LabelMe 的離線分支,最近關閉了新使用者註冊選項。所以,在這篇文章中,我們只考慮 labelme(小寫)。

該工具是具有直觀使用者介面的輕量級圖形應用程式。使用 labelme,您可以建立:多邊形、矩形、圓、線、點或線帶。

通常,能夠以眾所周知的格式(例如 COCO、YOLO 或 PASCAL VOL)匯出註釋以供後續使用通常很方便。但是,在 labelme 中,標籤只能直接從應用程式儲存為 JSON 檔案。如果要使用其他格式,可以使用 labelme 儲存庫中的 Python 指令碼將註釋轉換為 PASCAL VOL。

儘管如此,它還是一個相當可靠的應用程式,具有用於手動影像標記和廣泛的計算機視覺任務的簡單功能。

 

安裝和配置

labelme 是一個跨平臺的應用程式,可以在多個系統上工作,例如 Windows、Ubuntu 或 macOS。安裝本身非常簡單,這裡有很好的描述。例如,在 macOS 上,您需要在終端中執行以下命令:

  1. 安裝依賴:brew install pyqt

  2. 安裝labelme:pip install labelme

  3. 執行 labelme:labelme

 

labelImg

地址:https://github.com/tzutalin/labelImg

計算機視覺中的影像標註工具總結

你可以用它做什麼

labelImg 是一種廣泛使用的開源圖形註釋工具。它僅適用於目標定位或檢測任務,並且只能在考慮的物件周圍建立矩形框。

儘管存在這種限制,我們還是建議使用此工具,因為該應用程式僅專注於建立儘可能簡化工具的邊界框。對於此任務,labelImg 具有所有必要的功能和方便的鍵盤快捷鍵。

另一個優點是您可以以 3 種流行的註釋格式儲存/載入註釋:PASCAL VOC、YOLO 和 CreateML。

 

安裝和配置

這裡對安裝進行了很好的描述。還要注意 labelImg 是一個跨平臺的應用程式。例如,對於 MacOS,需要在命令列上執行以下操作:

  1. 安裝依賴:先 brew install qt,然後 brew install libxml2

  2. 選擇要安裝的資料夾的位置。

  3. 當你在資料夾中時,執行以下命令:git clone https://github.com/tzutalin/labelImg.git, cd labelImg 然後 make qt5py3

  4. 執行 labelImg:python3 labelImg.py

  5. 開發人員強烈建議使用 Python 3 或更高版本和 PyQt5。

 

 

CVAT

地址:https://github.com/openvinotoolkit/cvat

計算機視覺中的影像標註工具總結

你可以用它做什麼

CVAT 是一種用於影像和視訊的開源註釋工具,用於物件檢測、分割和分類等任務。

要使用此工具,您無需在計算機上安裝該應用程式。可以線上使用此工具的網路版本。您可以作為一個團隊協作處理標記影像並在使用者之間分配工作。

還有一個很好的選擇,它允許您使用預先訓練的模型來自動標記您的資料,如果您使用 CVAT 儀表板中現有的可用模型,這可以簡化最流行的類(例如,COCO 中包含的類)的過程。或者,您也可以使用自己的預訓練模型。

CVAT 具有我們已經考慮過的工具中最廣泛的功能集。特別是,它允許您以大約 15 種不同的格式儲存標籤。可以在此處找到完整的格式列表。

 

 

hasty.ai

地址:https://hasty.ai/

計算機視覺中的影像標註工具總結

你可以用它做什麼

與上述所有工具不同,hasty.ai 不是免費的開源服務,但由於所謂的物件檢測和分割的 AI 助手,它非常方便地標記資料。自動支援允許您顯著加快註釋過程,因為在標記期間輔助模型正在訓練。換句話說,標記的影像越多,助手的工作就越準確。我們將在下面看一個例子來說明它是如何工作的。您也可以免費試用此服務。該試驗提供 3000 積分,足以為一個物體檢測任務自動生成大約 3000 個物體的建議標籤。hasty.ai 允許您以 COCO 或 Pascal VOC 格式匯出資料。您還可以作為一個團隊處理單個專案並在專案設定中分配角色。免費積分用完後,hasty.ai 仍然可以免費使用,但標記將完全由手動操作。在這種情況下,最好考慮上述免費工具。

配置

  1. 要使用該工具,您需要在 hasty.ai 上註冊。

  2. 登入您的帳戶。

  3. 單擊建立新專案。

  4. 用名稱和描述填寫表單並導航到專案設定,您可以在其中定義考慮中的類,為該專案新增資料。

  5. 此外,您可以新增其他使用者來共同處理專案。積分將從共享專案的使用者的帳戶中使用。

 

原文地址:https://medium.com/dida-machine-learning/the-best-labeling-tools-for-computer-vision-bf4a9642f796

 

歡迎關注公眾號 CV技術指南 ,專注於計算機視覺的技術總結、最新技術跟蹤、經典論文解讀。

在公眾號中回覆關鍵字 “技術總結”可獲取公眾號原創技術總結文章的彙總pdf。

計算機視覺中的影像標註工具總結

其它文章

CV技術指南--精華文章彙總分類

神經網路超引數的調參方法總結

輕量化模型系列--GhostNet:廉價操作生成更多特徵

ICCV2021 | MicroNet:以極低的 FLOPs 改進影像識別

CVPR2021 | 重新思考BatchNorm中的Batch

ICCV2021 | 重新思考視覺transformers的空間維度

CVPR2021 | Transformer用於End-to-End視訊例項分割

ICCV2021 |(騰訊優圖)重新思考人群中的計數和定位:一個純粹基於點的框架

卷積神經網路的複雜度分析

2021年小目標檢測最新研究綜述

計算機視覺中的自注意力

綜述專欄 | 姿態估計綜述

漫談CUDA優化

為什麼GEMM是深度學習的核心

使用深度神經網路為什麼8位足夠?

經典論文系列--膠囊網路:新的深度學習網路

經典論文系列 | 目標檢測--CornerNet & 又名 anchor boxes的缺陷

如何看待人工智慧的泡沫

使用Dice loss實現清晰的邊界檢測

PVT--無卷積密集預測的多功能backbone

CVPR2021 | 開放世界的目標檢測

Siamese network總結

視覺目標檢測和識別之過去,現在及可能

在做演算法工程師的道路上,你掌握了什麼概念或技術使你感覺自我提升突飛猛進?

計算機視覺專業術語總結(一)構建計算機視覺的知識體系

欠擬合與過擬合技術總結

歸一化方法總結

論文創新的常見思路總結

CV方向的高效閱讀英文文獻方法總結

計算機視覺中的小樣本學習綜述   

知識蒸餾的簡要概述    

計算機視覺中的特徵金字塔技術總結

Siamese network總結

計算機視覺中的注意力機制技術總結

文字識別OCR開源框架的對比--Tesseract vs EasyOCR

計算機視覺專業術語總結(一)構建計算機視覺的知識體系

北京大學施柏鑫:從審稿人視角,談談怎麼寫一篇CVPR論文

歸一化方法總結

計算機視覺的高效閱讀英文文獻方法總結

計算機視覺中的小樣本學習綜述

知識蒸餾的簡要概述

損失函式技術總結

CVPR2021 | 開放世界的目標檢測

CVPR2021|PVT--無卷積密集預測的多功能backbone

CVPR2021|特徵金字塔的新方式YOLOF

CVPR2021 | 華為諾亞實驗室提出Transformer in Transformer

CVPR2021| 繼SE,CBAM後的一種新的注意力機制Coordinate Attention

經典論文系列 | 重新思考在ImageNet上的預訓練

相關文章