電腦視覺中的影像標註工具總結

  • 2021 年 9 月 19 日
  • 筆記

 本文來自公眾號CV技術指南資源分享系列

創建高品質的數據集是任何機器學習項目的關鍵部分。在實踐中,這通常比實際訓練和超參數優化花費的時間更長。因此,選擇合適的標註工具至關重要。在這裡,我們總結了一些用於電腦視覺任務的最佳影像標註工具:labelme、labelImg、CVAT和hasty.ai。

 

作者:Dmitrii

編譯:CV技術指南

歡迎關注公眾號CV技術指南,專註於電腦視覺的技術總結、最新技術跟蹤、經典論文解讀

 

labelme

地址://github.com/wkentaro/labelme

你可以用它做什麼

labelme 是一個基於 python 的開源影像多邊形標註工具,可用於手動標註影像以進行對象檢測、分割和分類。它是在線 LabelMe 的離線分支,最近關閉了新用戶註冊選項。所以,在這篇文章中,我們只考慮 labelme(小寫)。

該工具是具有直觀用戶介面的輕量級圖形應用程式。使用 labelme,您可以創建:多邊形、矩形、圓、線、點或線帶。

通常,能夠以眾所周知的格式(例如 COCO、YOLO 或 PASCAL VOL)導出注釋以供後續使用通常很方便。但是,在 labelme 中,標籤只能直接從應用程式保存為 JSON 文件。如果要使用其他格式,可以使用 labelme 存儲庫中的 Python 腳本將注釋轉換為 PASCAL VOL。

儘管如此,它還是一個相當可靠的應用程式,具有用於手動影像標記和廣泛的電腦視覺任務的簡單功能。

 

安裝和配置

labelme 是一個跨平台的應用程式,可以在多個系統上工作,例如 Windows、Ubuntu 或 macOS。安裝本身非常簡單,這裡有很好的描述。例如,在 macOS 上,您需要在終端中運行以下命令:

  1. 安裝依賴:brew install pyqt

  2. 安裝labelme:pip install labelme

  3. 運行 labelme:labelme

 

labelImg

地址://github.com/tzutalin/labelImg

你可以用它做什麼

labelImg 是一種廣泛使用的開源圖形注釋工具。它僅適用於目標定位或檢測任務,並且只能在考慮的對象周圍創建矩形框。

儘管存在這種限制,我們還是建議使用此工具,因為該應用程式僅專註於創建儘可能簡化工具的邊界框。對於此任務,labelImg 具有所有必要的功能和方便的鍵盤快捷鍵。

另一個優點是您可以以 3 種流行的注釋格式保存/載入注釋:PASCAL VOC、YOLO 和 CreateML。

 

安裝和配置

這裡對安裝進行了很好的描述。還要注意 labelImg 是一個跨平台的應用程式。例如,對於 MacOS,需要在命令行上執行以下操作:

  1. 安裝依賴:先 brew install qt,然後 brew install libxml2

  2. 選擇要安裝的文件夾的位置。

  3. 當你在文件夾中時,運行以下命令:git clone //github.com/tzutalin/labelImg.git, cd labelImg 然後 make qt5py3

  4. 運行 labelImg:python3 labelImg.py

  5. 開發人員強烈建議使用 Python 3 或更高版本和 PyQt5。

 

 

CVAT

地址://github.com/openvinotoolkit/cvat

你可以用它做什麼

CVAT 是一種用於影像和影片的開源注釋工具,用於對象檢測、分割和分類等任務。

要使用此工具,您無需在電腦上安裝該應用程式。可以在線使用此工具的網路版本。您可以作為一個團隊協作處理標記影像並在用戶之間分配工作。

還有一個很好的選擇,它允許您使用預先訓練的模型來自動標記您的數據,如果您使用 CVAT 儀錶板中現有的可用模型,這可以簡化最流行的類(例如,COCO 中包含的類)的過程。或者,您也可以使用自己的預訓練模型。

CVAT 具有我們已經考慮過的工具中最廣泛的功能集。特別是,它允許您以大約 15 種不同的格式保存標籤。可以在此處找到完整的格式列表。

 

 

hasty.ai

地址://hasty.ai/

你可以用它做什麼

與上述所有工具不同,hasty.ai 不是免費的開源服務,但由於所謂的對象檢測和分割的 AI 助手,它非常方便地標記數據。自動支援允許您顯著加快注釋過程,因為在標記期間輔助模型正在訓練。換句話說,標記的影像越多,助手的工作就越準確。我們將在下面看一個例子來說明它是如何工作的。您也可以免費試用此服務。該試驗提供 3000 積分,足以為一個物體檢測任務自動生成大約 3000 個物體的建議標籤。hasty.ai 允許您以 COCO 或 Pascal VOC 格式導出數據。您還可以作為一個團隊處理單個項目並在項目設置中分配角色。免費積分用完後,hasty.ai 仍然可以免費使用,但標記將完全由手動操作。在這種情況下,最好考慮上述免費工具。

配置

  1. 要使用該工具,您需要在 hasty.ai 上註冊。

  2. 登錄您的帳戶。

  3. 單擊創建新項目。

  4. 用名稱和描述填寫表單並導航到項目設置,您可以在其中定義考慮中的類,為該項目添加數據。

  5. 此外,您可以添加其他用戶來共同處理項目。積分將從共享項目的用戶的帳戶中使用。

 

原文地址://medium.com/dida-machine-learning/the-best-labeling-tools-for-computer-vision-bf4a9642f796

 

歡迎關注公眾號 CV技術指南 ,專註於電腦視覺的技術總結、最新技術跟蹤、經典論文解讀。

在公眾號中回復關鍵字 「技術總結」可獲取公眾號原創技術總結文章的匯總pdf。

其它文章

CV技術指南–精華文章匯總分類

神經網路超參數的調參方法總結

輕量化模型系列–GhostNet:廉價操作生成更多特徵

ICCV2021 | MicroNet:以極低的 FLOPs 改進影像識別

CVPR2021 | 重新思考BatchNorm中的Batch

ICCV2021 | 重新思考視覺transformers的空間維度

CVPR2021 | Transformer用於End-to-End影片實例分割

ICCV2021 |(騰訊優圖)重新思考人群中的計數和定位:一個純粹基於點的框架

卷積神經網路的複雜度分析

2021年小目標檢測最新研究綜述

電腦視覺中的自注意力

綜述專欄 | 姿態估計綜述

漫談CUDA優化

為什麼GEMM是深度學習的核心

使用深度神經網路為什麼8位足夠?

經典論文系列–膠囊網路:新的深度學習網路

經典論文系列 | 目標檢測–CornerNet & 又名 anchor boxes的缺陷

如何看待人工智慧的泡沫

使用Dice loss實現清晰的邊界檢測

PVT–無卷積密集預測的多功能backbone

CVPR2021 | 開放世界的目標檢測

Siamese network總結

視覺目標檢測和識別之過去,現在及可能

在做演算法工程師的道路上,你掌握了什麼概念或技術使你感覺自我提升突飛猛進?

電腦視覺專業術語總結(一)構建電腦視覺的知識體系

欠擬合與過擬合技術總結

歸一化方法總結

論文創新的常見思路總結

CV方向的高效閱讀英文文獻方法總結

電腦視覺中的小樣本學習綜述   

知識蒸餾的簡要概述    

電腦視覺中的特徵金字塔技術總結

Siamese network總結

電腦視覺中的注意力機制技術總結

文字識別OCR開源框架的對比–Tesseract vs EasyOCR

電腦視覺專業術語總結(一)構建電腦視覺的知識體系

北京大學施柏鑫:從審稿人視角,談談怎麼寫一篇CVPR論文

歸一化方法總結

電腦視覺的高效閱讀英文文獻方法總結

電腦視覺中的小樣本學習綜述

知識蒸餾的簡要概述

損失函數技術總結

CVPR2021 | 開放世界的目標檢測

CVPR2021|PVT–無卷積密集預測的多功能backbone

CVPR2021|特徵金字塔的新方式YOLOF

CVPR2021 | 華為諾亞實驗室提出Transformer in Transformer

CVPR2021| 繼SE,CBAM後的一種新的注意力機制Coordinate Attention

經典論文系列 | 重新思考在ImageNet上的預訓練