5款最佳CV和数据科学标记工具,标记公司、初创企业、个人用户全满足

  • 2019 年 10 月 4 日
  • 笔记


【新智元导读】计算机视觉的数据科学家经常需要快速简单的标记工具用来为PoC或R&D实验创建数据集,以及确保数据质量,以免影响深度学习算法的性能。本文介绍了5种非常棒的注释工具!

计算机视觉的数据科学家经常需要快速简单的标记工具用来为PoC或R&D实验创建数据集,以及确保数据质量,以免影响深度学习算法的性能。本文介绍了5种非常棒的注释工具,如果你发现这些工具无法按预期工作,请尝试在Chrome中运行它们

在此之前,你需要明确不同类型的企业,对标记的要求不同。如果是大型企业:

  • 高级项目管理功能
  • 大量的功能,所以任何任务都可以完成
  • 提高效率的自动化工具

如果是创业公司:

  • API或至少是将标记工具连接到私有API的简单方法
  • 直观的用户体验(UX),因此你临时招聘的每个注释者都可以立即开始工作

只是个人:

  • 不关心API/项目管理
  • 只想尽可能快地开始标记!

计算机视觉中标记的基础知识

在计算机视觉中,主要有三种类型的数据用于训练算法:

  • 训练分类器的图片+标记(ResNets)
  • 探测器的边界框+标记(YOLOv3,更快的R-CNN …)
  • 用于分割应用的多边形+标记(Mask R-CNN)

你也可能已经意识到,AI项目成功的最重要因素之一是可以使用的“高质量数据”的数量。当然,什么是高质量的数据,还没有一个明确的定义。这里我们说的所谓“高质量数据”的意思是:

  • 每张图片/注释都有一个合适的标记
  • 每个边界框或多边形准确地围绕实体进行训练

适用于标记公司的最佳开源注释工具

计算机视觉注释工具(CVAT)

在推出OpenCV近20年后,英特尔在计算机视觉领域重申并发布了CVAT,这是一款功能强大且完整的注释工具。 尽管需要一些时间来学习和掌握,但它提出了大量用于标记计算机视觉数据的功能。

优势:

  • 易于安装和扩展,因为它是在Docker中运行的Web应用程序
  • 提出了许多自动化仪器(例如使用TensorFlow *对象检测API进行自动注释,视频插值……)
  • 允许管理协作工作,因此团队的不同成员可以在同一个注释任务上一起工作

弱点:

  • 用户界面非常复杂。例如,第一次设置注释任务可能非常棘手
  • 一开始不是很直观,掌握可能需要几天时间
  • 只能运行在Chrome下

在线演示:

https://c.onepanel.io/onepanel-demo/projects/cvat-public-demo/workspaces

适用于初创公司的最佳开源注释工具

视觉对象标记工具(VoTT)

VoTT由微软开发,提供了极好的用户体验,可以在注释时节省大量的时间和精力。此外,创建项目也很简单,因此你无需深入了解文档即可使用它。

优势:

  • 代码写得非常好(在React中),并且完美地定义了接口,因此很容易分叉并添加你需要的额外功能
  • 用户体验不错。暗黑主题和鼠标后面的虚线网格,所以很容易知道从哪里开始一个边界框
  • 建议使用深度学习算法来自动检测对象(随附在COCO类上训练的SSD)
  • 是一个网络应用程序和电子应用程序。这使你可以将其用作胖客户端或在Web浏览器中运行的应用程序

弱点:

  • 要使用Web应用程序版本,需要将数据托管在Microsoft的云计算服务Azure上(但是,电子版允许你使用硬盘驱动器磁盘上的数据,但需要使用npm安装它)
  • 没有提供内置的API(调整代码很容易让你的私有API与它进行通信)
  • 无法标记图片:你只能使用关联的标记绘制边界框(或多边形)。因此,它不适合创建分类数据集

演示:

https://vott.z5.web.core.windows.net/

DataTurks

DataTurks是一家创建于2018年的创业公司,提供标记图像,视频和文本的服务。注释工具很棒且现在是免费的,可以使用它的所有功能(我已经尝试并测试过它)!

优势:

  • 一个在Docker中运行的Web应用程序
  • 允许协作和异步工作:处理同一数据集的两个团队成员将无法获得相同的图像进行注释
  • 提出用于创建和获取注释任务的API

弱点:

  • DataTurks似乎已停止继续维护其产品
  • 用户体验还可以

在线演示:

https://dataturks.com/projects/Dataturks

最适合个人使用的开源图像标记工具

Make-Sense

虽然Make-sense比较晚出世,已经拥有了令人难以置信的用户体验。开始注释从来没有这么快!转到网站,拖放图像并开始注释。

优势:

  • 快速,高效,但最重要的是,简单!
  • 真的很酷的UX
  • 关于你加载的图像的隐私,不要担心,因为他们说:“[他们]不存储你的图像,因为[他们]不首先将它们发送到任何地方”

弱点:

  • 不提供任何项目管理功能
  • 不提供任何API

在这里开始标记:

https://www.makesense.ai