本文來自 資源分享系列
建立高質量的資料集是任何機器學習專案的關鍵部分。在實踐中,這通常比實際訓練和超引數優化花費的時間更長。因此,選擇合適的標註工具至關重要。在這裡,我們總結了一些用於計算機視覺任務的最佳影像標註工具:labelme、labelImg、CVAT和hasty.ai。
作者:Dmitrii
編譯:CV技術指南
歡迎關注公眾號CV技術指南,專注於計算機視覺的技術總結、最新技術跟蹤、經典論文解讀。
labelme
地址:https://github.com/wkentaro/labelme
你可以用它做什麼
labelme 是一個基於 python 的開源影像多邊形標註工具,可用於手動標註影像以進行物件檢測、分割和分類。它是線上 LabelMe 的離線分支,最近關閉了新使用者註冊選項。所以,在這篇文章中,我們只考慮 labelme(小寫)。
該工具是具有直觀使用者介面的輕量級圖形應用程式。使用 labelme,您可以建立:多邊形、矩形、圓、線、點或線帶。
通常,能夠以眾所周知的格式(例如 COCO、YOLO 或 PASCAL VOL)匯出註釋以供後續使用通常很方便。但是,在 labelme 中,標籤只能直接從應用程式儲存為 JSON 檔案。如果要使用其他格式,可以使用 labelme 儲存庫中的 Python 指令碼將註釋轉換為 PASCAL VOL。
儘管如此,它還是一個相當可靠的應用程式,具有用於手動影像標記和廣泛的計算機視覺任務的簡單功能。
安裝和配置
labelme 是一個跨平臺的應用程式,可以在多個系統上工作,例如 Windows、Ubuntu 或 macOS。安裝本身非常簡單,這裡有很好的描述。例如,在 macOS 上,您需要在終端中執行以下命令:
-
安裝依賴:brew install pyqt
-
安裝labelme:pip install labelme
-
執行 labelme:labelme
labelImg
地址:https://github.com/tzutalin/labelImg
你可以用它做什麼
labelImg 是一種廣泛使用的開源圖形註釋工具。它僅適用於目標定位或檢測任務,並且只能在考慮的物件周圍建立矩形框。
儘管存在這種限制,我們還是建議使用此工具,因為該應用程式僅專注於建立儘可能簡化工具的邊界框。對於此任務,labelImg 具有所有必要的功能和方便的鍵盤快捷鍵。
另一個優點是您可以以 3 種流行的註釋格式儲存/載入註釋:PASCAL VOC、YOLO 和 CreateML。
安裝和配置
這裡對安裝進行了很好的描述。還要注意 labelImg 是一個跨平臺的應用程式。例如,對於 MacOS,需要在命令列上執行以下操作:
-
安裝依賴:先 brew install qt,然後 brew install libxml2
-
選擇要安裝的資料夾的位置。
-
當你在資料夾中時,執行以下命令:git clone https://github.com/tzutalin/labelImg.git, cd labelImg 然後 make qt5py3
-
執行 labelImg:python3 labelImg.py
-
開發人員強烈建議使用 Python 3 或更高版本和 PyQt5。
CVAT
地址:https://github.com/openvinotoolkit/cvat
你可以用它做什麼
CVAT 是一種用於影像和視訊的開源註釋工具,用於物件檢測、分割和分類等任務。
要使用此工具,您無需在計算機上安裝該應用程式。可以線上使用此工具的網路版本。您可以作為一個團隊協作處理標記影像並在使用者之間分配工作。
還有一個很好的選擇,它允許您使用預先訓練的模型來自動標記您的資料,如果您使用 CVAT 儀表板中現有的可用模型,這可以簡化最流行的類(例如,COCO 中包含的類)的過程。或者,您也可以使用自己的預訓練模型。
CVAT 具有我們已經考慮過的工具中最廣泛的功能集。特別是,它允許您以大約 15 種不同的格式儲存標籤。可以在此處找到完整的格式列表。
hasty.ai
地址:https://hasty.ai/
你可以用它做什麼
與上述所有工具不同,hasty.ai 不是免費的開源服務,但由於所謂的物件檢測和分割的 AI 助手,它非常方便地標記資料。自動支援允許您顯著加快註釋過程,因為在標記期間輔助模型正在訓練。換句話說,標記的影像越多,助手的工作就越準確。我們將在下面看一個例子來說明它是如何工作的。您也可以免費試用此服務。該試驗提供 3000 積分,足以為一個物體檢測任務自動生成大約 3000 個物體的建議標籤。hasty.ai 允許您以 COCO 或 Pascal VOC 格式匯出資料。您還可以作為一個團隊處理單個專案並在專案設定中分配角色。免費積分用完後,hasty.ai 仍然可以免費使用,但標記將完全由手動操作。在這種情況下,最好考慮上述免費工具。
配置
-
要使用該工具,您需要在 hasty.ai 上註冊。
-
登入您的帳戶。
-
單擊建立新專案。
-
用名稱和描述填寫表單並導航到專案設定,您可以在其中定義考慮中的類,為該專案新增資料。
-
此外,您可以新增其他使用者來共同處理專案。積分將從共享專案的使用者的帳戶中使用。
原文地址:https://medium.com/dida-machine-learning/the-best-labeling-tools-for-computer-vision-bf4a9642f796
歡迎關注公眾號 CV技術指南 ,專注於計算機視覺的技術總結、最新技術跟蹤、經典論文解讀。
在公眾號中回覆關鍵字 “技術總結”可獲取公眾號原創技術總結文章的彙總pdf。
其它文章