計算機視覺中的影像標註工具總結

CV技術指南(公眾號) 發表於 2021-09-19

 本文來自公眾號CV技術指南資源分享系列

建立高質量的資料集是任何機器學習專案的關鍵部分。在實踐中,這通常比實際訓練和超引數優化花費的時間更長。因此,選擇合適的標註工具至關重要。在這裡,我們總結了一些用於計算機視覺任務的最佳影像標註工具:labelme、labelImg、CVAT和hasty.ai。

 

作者:Dmitrii

編譯:CV技術指南

歡迎關注公眾號CV技術指南,專注於計算機視覺的技術總結、最新技術跟蹤、經典論文解讀

 

labelme

地址:https://github.com/wkentaro/labelme

計算機視覺中的影像標註工具總結

計算機視覺中的影像標註工具總結

你可以用它做什麼

labelme 是一個基於 python 的開源影像多邊形標註工具,可用於手動標註影像以進行物件檢測、分割和分類。它是線上 LabelMe 的離線分支,最近關閉了新使用者註冊選項。所以,在這篇文章中,我們只考慮 labelme(小寫)。

該工具是具有直觀使用者介面的輕量級圖形應用程式。使用 labelme,您可以建立:多邊形、矩形、圓、線、點或線帶。

通常,能夠以眾所周知的格式(例如 COCO、YOLO 或 PASCAL VOL)匯出註釋以供後續使用通常很方便。但是,在 labelme 中,標籤只能直接從應用程式儲存為 JSON 檔案。如果要使用其他格式,可以使用 labelme 儲存庫中的 Python 指令碼將註釋轉換為 PASCAL VOL。

儘管如此,它還是一個相當可靠的應用程式,具有用於手動影像標記和廣泛的計算機視覺任務的簡單功能。

 

安裝和配置

labelme 是一個跨平臺的應用程式,可以在多個系統上工作,例如 Windows、Ubuntu 或 macOS。安裝本身非常簡單,這裡有很好的描述。例如,在 macOS 上,您需要在終端中執行以下命令:

  1. 安裝依賴:brew install pyqt

  2. 安裝labelme:pip install labelme

  3. 執行 labelme:labelme

 

labelImg

地址:https://github.com/tzutalin/labelImg

計算機視覺中的影像標註工具總結

計算機視覺中的影像標註工具總結

你可以用它做什麼

labelImg 是一種廣泛使用的開源圖形註釋工具。它僅適用於目標定位或檢測任務,並且只能在考慮的物件周圍建立矩形框。

儘管存在這種限制,我們還是建議使用此工具,因為該應用程式僅專注於建立儘可能簡化工具的邊界框。對於此任務,labelImg 具有所有必要的功能和方便的鍵盤快捷鍵。

另一個優點是您可以以 3 種流行的註釋格式儲存/載入註釋:PASCAL VOC、YOLO 和 CreateML。

 

安裝和配置

這裡對安裝進行了很好的描述。還要注意 labelImg 是一個跨平臺的應用程式。例如,對於 MacOS,需要在命令列上執行以下操作:

  1. 安裝依賴:先 brew install qt,然後 brew install libxml2

  2. 選擇要安裝的資料夾的位置。

  3. 當你在資料夾中時,執行以下命令:git clone https://github.com/tzutalin/labelImg.git, cd labelImg 然後 make qt5py3

  4. 執行 labelImg:python3 labelImg.py

  5. 開發人員強烈建議使用 Python 3 或更高版本和 PyQt5。

 

 

CVAT

地址:https://github.com/openvinotoolkit/cvat

計算機視覺中的影像標註工具總結

計算機視覺中的影像標註工具總結

你可以用它做什麼

CVAT 是一種用於影像和視訊的開源註釋工具,用於物件檢測、分割和分類等任務。

要使用此工具,您無需在計算機上安裝該應用程式。可以線上使用此工具的網路版本。您可以作為一個團隊協作處理標記影像並在使用者之間分配工作。

還有一個很好的選擇,它允許您使用預先訓練的模型來自動標記您的資料,如果您使用 CVAT 儀表板中現有的可用模型,這可以簡化最流行的類(例如,COCO 中包含的類)的過程。或者,您也可以使用自己的預訓練模型。

CVAT 具有我們已經考慮過的工具中最廣泛的功能集。特別是,它允許您以大約 15 種不同的格式儲存標籤。可以在此處找到完整的格式列表。

 

 

hasty.ai

地址:https://hasty.ai/

計算機視覺中的影像標註工具總結

計算機視覺中的影像標註工具總結

你可以用它做什麼

與上述所有工具不同,hasty.ai 不是免費的開源服務,但由於所謂的物件檢測和分割的 AI 助手,它非常方便地標記資料。自動支援允許您顯著加快註釋過程,因為在標記期間輔助模型正在訓練。換句話說,標記的影像越多,助手的工作就越準確。我們將在下面看一個例子來說明它是如何工作的。您也可以免費試用此服務。該試驗提供 3000 積分,足以為一個物體檢測任務自動生成大約 3000 個物體的建議標籤。hasty.ai 允許您以 COCO 或 Pascal VOC 格式匯出資料。您還可以作為一個團隊處理單個專案並在專案設定中分配角色。免費積分用完後,hasty.ai 仍然可以免費使用,但標記將完全由手動操作。在這種情況下,最好考慮上述免費工具。

配置

  1. 要使用該工具,您需要在 hasty.ai 上註冊。

  2. 登入您的帳戶。

  3. 單擊建立新專案。

  4. 用名稱和描述填寫表單並導航到專案設定,您可以在其中定義考慮中的類,為該專案新增資料。

  5. 此外,您可以新增其他使用者來共同處理專案。積分將從共享專案的使用者的帳戶中使用。

 

原文地址:https://medium.com/dida-machine-learning/the-best-labeling-tools-for-computer-vision-bf4a9642f796

 

歡迎關注公眾號 CV技術指南 ,專注於計算機視覺的技術總結、最新技術跟蹤、經典論文解讀。

在公眾號中回覆關鍵字 “技術總結”可獲取公眾號原創技術總結文章的彙總pdf。

計算機視覺中的影像標註工具總結計算機視覺中的影像標註工具總結

其它文章

CV技術指南--精華文章彙總分類

神經網路超引數的調參方法總結

輕量化模型系列--GhostNet:廉價操作生成更多特徵

ICCV2021 | MicroNet:以極低的 FLOPs 改進影像識別

CVPR2021 | 重新思考BatchNorm中的Batch

ICCV2021 | 重新思考視覺transformers的空間維度

CVPR2021 | Transformer用於End-to-End視訊例項分割

ICCV2021 |(騰訊優圖)重新思考人群中的計數和定位:一個純粹基於點的框架

卷積神經網路的複雜度分析

2021年小目標檢測最新研究綜述

計算機視覺中的自注意力

綜述專欄 | 姿態估計綜述

漫談CUDA優化

為什麼GEMM是深度學習的核心

使用深度神經網路為什麼8位足夠?

經典論文系列--膠囊網路:新的深度學習網路

經典論文系列 | 目標檢測--CornerNet & 又名 anchor boxes的缺陷

如何看待人工智慧的泡沫

使用Dice loss實現清晰的邊界檢測

PVT--無卷積密集預測的多功能backbone

CVPR2021 | 開放世界的目標檢測

Siamese network總結

視覺目標檢測和識別之過去,現在及可能

在做演算法工程師的道路上,你掌握了什麼概念或技術使你感覺自我提升突飛猛進?

計算機視覺專業術語總結(一)構建計算機視覺的知識體系

欠擬合與過擬合技術總結

歸一化方法總結

論文創新的常見思路總結

CV方向的高效閱讀英文文獻方法總結

計算機視覺中的小樣本學習綜述   

知識蒸餾的簡要概述    

計算機視覺中的特徵金字塔技術總結

Siamese network總結

計算機視覺中的注意力機制技術總結

文字識別OCR開源框架的對比--Tesseract vs EasyOCR

計算機視覺專業術語總結(一)構建計算機視覺的知識體系

北京大學施柏鑫:從審稿人視角,談談怎麼寫一篇CVPR論文

歸一化方法總結

計算機視覺的高效閱讀英文文獻方法總結

計算機視覺中的小樣本學習綜述

知識蒸餾的簡要概述

損失函式技術總結

CVPR2021 | 開放世界的目標檢測

CVPR2021|PVT--無卷積密集預測的多功能backbone

CVPR2021|特徵金字塔的新方式YOLOF

CVPR2021 | 華為諾亞實驗室提出Transformer in Transformer

CVPR2021| 繼SE,CBAM後的一種新的注意力機制Coordinate Attention

經典論文系列 | 重新思考在ImageNet上的預訓練