Faster R-CNN
Carpe Tu Black Whistle

Faster R-CNN

Faster R-CNN 是 Ross Girshick继Fast R-CNN后的又一力作。同样使用VGG16作为网络的backbone,推理速度在GPU上达到5fps(包括候选区域的生成),准确率也有进一步的提升。在2015年的ILSVRC以及COCO竞赛中获得多个项目第一名。

pipeline

  • 将图像输入网络得到相应的特征图
  • 使用RPN结构生成候选框,将RPN生成的候选框投影到特征图上获得相应的特征矩阵
  • 将每个特征矩阵通过ROI pooling层缩放到7x7大小的特征图,接着将特征图展平通过一系列全链接层得到预测结果

Faster R-CNN = RPN + Fast R-CNN
image

核心内容是,用RPN替代了Fast R-CNN中的候选框提取部分

paper

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

Region Proposal Network

image