伊利诺伊大学和微软研究院提出:用于目标检测的 Anchor Box 优化

  • 2019 年 12 月 31 日
  • 筆記

前戏

前几天更了一篇超全的Anchor文章目标检测最新方向:推翻固有设置,不再一成不变Anchor,但其中并没有包含本文分享的论文。

【导读】今天分享一篇伊利诺伊大学香槟分校和微软研究院(Microsoft Research)前段时间出的论文。

正文

《Anchor Box Optimization for Object Detection》

arXiv: https://arxiv.org/abs/1812.00469

github:None

作者团队:伊利诺伊大学香槟分校和微软研究院

时间:2018年12月02日

方向:目标检测

Abstract:在本文中,我们提出了一种用于优化目标检测的 anchor boxes的通用方法。如今,anchor boxes(锚框) 在最先进的检测框架中被广泛采用。但是,所有这些框架都以启发式方式预定义 anchor boxes形状,并在训练期间 fix 大小。为了提高准确性并减少设计 anchor boxes的工作量,我们建议动态学习形状,使 anchors 能够自动适应数据分布和网络学习能力。学习方法可以通过随机梯度下降方式轻松实现,并插入任何基于 anchor boxes 的检测框架。额外的训练成本几乎可以忽略不计,并且对推理时间成本没有影响。详尽的实验还表明,在包括Pascal VOC 07 + 12,MS COCO和Brainwash在内的几个基准数据集上,所提出的 anchor 优化方法在 baseline 方法上始终如一地实现了显著的改进(≥1%mAP绝对 gain)。同时,还针对不同的 anchor boxes 初始化方法验证了鲁棒性,极大地简化了 anchor boxes 设计的问题。

本文算法

通过结合 localization loss和 classification loss,我们可以将优化问题写成:

所提出的网络结构

An illustration of the anchor optimization process

创新点

  • Online Clustering Warm-Up
  • Soft Assignment Warm-Up
  • Batch Normalization without Shifting

实验结果

本文在 Pascal VOC 07 + 12 和 MS-COCO Challenge 2017,以及 Brainwash 的头部检测数据集上进行实验,验证提出的 anchor 优化方法的有效性。

PASCAL VOC

MS COCO

Brainwash

结论:本文的工作解决了优化 ahchor 形状的问题,而不是 anchor 的数量,这将是一个有趣的研究课题。最后,关于 anchor 机制为何以及如何比简单回归更好地工作的理论研究对于该领域也是非常有价值的。