R-CNN,Fast R-CNN,Faster-RCNN快速理解

  • 2020 年 2 月 24 日
  • 筆記

检测资源合集http://objectdetection.cn/2018/05/14/awesome-object-detection/

R-CNN

R-CNN

测试过程

这位博主写的真好,没有找到源头,这里地址也是转载的https://blog.csdn.net/weixin_41923961/article/details/80246244

Fast-RCNN

Fast R-CNN

ROI池化层解释

关于ROI池化层解释https://blog.csdn.net/gusui7202/article/details/80651416 1.将图片用选择搜索算法(selective search)得到2000个候选区域(region proposals)的坐标信息

2.将整张图片归一化224*224输入到CNN ,整张图片送入CNN。

3.图片然后经过5层卷积操作后,得到一张特征图。(feature maps),利用开始得到的坐标(步骤1)通过一定的映射关系转换为对应特征图上的坐标,截取对应的候选区域。

4.每个候选区经过RoI pooling后提取到固定长度的特征向量如上图3*3的特征,送入全连接层。

5.然后分别经过为21和84维的全连接层(并列的,前者是分类输出,后者是回归输出)。一个为多个目标类生成softmax概率估计,而另一个为每个目标类生成4个实数值。这4个数字表示每个目标的边界框的位置。

优点 不需要先分类再回归(R-CNN 中的步骤5和6),将这两个任务合并 Fast R-CNN通过CNN直接获取整张图像的特征图,再使用RoI Pooling Layer在特征图上获取对应每个候选框的特征,避免了R-CNN中的对每个候选框串行进行卷积(耗时较长)

Faster-RCNN

Faster R-CNN 取代selective search,直接通过一个网络学习【Region Proposal Network (RPN)】生成待检测区域。

Object Instance Mining for WeaklySupervised Object Detection

挖掘可靠的proposal