1. 磐创AI首页
  2. Medium

 - FCOS述评:全卷积单阶段目标检测


本文综述了阿德莱德大学的FCOS:全卷积单阶段目标检测。在本文中:

  • FCOS算法完全避免了训练过程中计算重叠等与锚盒相关的复杂计算。
  • 它还避免了与锚定框相关的所有超参数。
  • FCOS鼓励重新考虑锚箱的需求。

这是一篇被引用超过1000篇的2019年ICCV论文。(曾锡豪@Medium)Sik-Ho Tsang

大纲

1.FCOS:网络架构

1.1.符号、输入、输出

  • 设Fi(大小为H×W×C)为主干CNN第一层的特征映射,s为到该层的总步长。
  • 将输入图像的地面真实边界框定义为{Bi},其中Bi=(x(I)0,y(I)0,x(I)1,y(I)1,c(I)),其中{x(I)0,y(I)0},{x(I)1,y(I)1}分别是边界框的左上角和右下角的坐标。C(I)是对象类。
  • C是班级总数。例如:在MS Coco中C=80。
  • 具体地说,如果位置(x,y)落入任何地真盒中,则它被认为是正样本,并且该位置的类标c*是地真盒的类标。否则为负样本,c*=0(背景类)。
  • 4D实向量t*=(l*,t*,r*,b*)是该位置的回归目标,如故事顶部的第一个图所示。这里l*,t*,r*,b*是从该位置到边界框四边的距离。
  • 形式上,如果位置(x,y)与边界框Bi相关联,则该位置的训练回归目标可以表示为(Eq.(1)):

  • 我们的网络的最后一层预测分类标签的80D向量p和4D向量t=(l,t,r,b)边界框坐标。
  • C个二值分类器的训练。
  • 在骨干网络的特征图之后分别添加4个卷积层,分别用于分类和回归分支。
  • 由于回归目标始终为正,因此使用EXP(X)将任何实数映射到回归分支顶部的(0,∞)。

1.2.损失函数

  • 损失函数为(等式)。(2)):

  • 其中LCLS是RetinaNet中的焦点丢失。Lreg是欠条的遗失。NPO表示正样本的个数,本文中λ为1是LREG的平衡权重。
  • 在特征地图Fi上的所有位置上计算总和。1{c*i>0}是指示器函数,如果c*i>0,则为1,否则为0。

1.3.推理

  • 给定输入图像,图像通过网络并获得特征地图Fi上每个位置的分类分数Px,y和回归预测Tx,y。
  • 在RetinanNet之后,我们选择Px,y>0.05的位置作为正样本,并反演公式。(1)获取预测包围盒。

  • 如果一个位置落入多个边界框中,则将其视为不明确样本。我们简单地选择面积最小的包围盒作为其回归目标。
  • 与基于锚点的检测器不同,基于锚点的检测器将不同大小的锚框分配给不同的特征级别,而边界框回归的范围对于每个级别都是直接有限的。
  • 范围mi是要素高程i需要回归的最大距离。在本工作中,m2、m3、m4、m5、m6和m7分别设置为0、64、128、256、512和∞。
  • 更具体地说,我们首先计算所有特征级别上每个位置的回归目标l*、t*、r*、b*。接下来,如果位置满足MAX(l*,t*,r*,b*)>mi或max(l*,t*,r*,b*)
  • 如果一个位置,即使使用了多层预测,仍然被分配到多个地面实值盒子,则简单地选择面积最小的地面实值盒子作为其目标。
  • 在不同的特征级别之间共享头部,不仅使检测器的参数效率更高,而且提高了检测性能。
  • 由于不同的特征映射针对不同的对象大小,使用可训练标量si的exp(si×x)来自动调整特征级PI的指数函数的基数,而不是exp(X),从而提高了一点精度性能。

2.2.FCOS的中心性

  • 在FCOS中使用多级预测后,与基于锚点的检测器相比,性能仍有差距。这是由于远离对象中心的位置产生了大量低质量的预测边界框。
  • 中心度被用来解决这个问题(等式)。(3)):

  • 中心度描述了从该位置到该位置负责的对象的中心的归一化距离。
  • 中心度的范围从0到1,因此用二元交叉熵(BCE)损失来训练。将损失添加到损失函数Eq.(2)。
  • 在测试时,通过将预测的中心度与相应的分类分数相乘来计算最终分数(用于对检测到的边界框进行排序)。因此,中心度可以降低远离对象中心的边界框分数。

3.烧蚀研究

  • COCO traval35k Split(115K图像)用于训练,Minival Split(5K图像)用于验证。

3.2.中心度

  • 中心度+也可以用预测的回归向量来计算,而不需要引入额外的中心度分支。但它不能改善AP。

3.3。其他改进

  • “CTR。在注册表上“:将中心度分支移动到回归分支。
  • “CTR。抽样“:只抽样地面实况盒的中心部分作为阳性样本。
  • “GIOU”:在欠条损失中处罚外接矩形区域上的联合区域。
  • “归一化”:将等式中的回归目标归一化。(1)随着FPN水平的跨度
  • 下面的SOTA比较中没有使用这些改进。这是在论文最初的深渊翻滚之后发现的。

4.SOTA比较

4.1.MS COCO测试开发拆分

  • 在MS-COCO基准的测试开发拆分上,FCOS与其他最先进的对象检测器配合使用。
  • 使用ResNet-101-FPN时,FCOS的性能比使用相同主干ResNet-101-FPN的Retinanet高2.4%AP。
  • FCOS的性能也远远超过其他经典的两级锚定检测器,如更快的R-CNN。
  • 以ResNeXt-64x4d-101-FPN为主干,FCOS在AP中达到43.2%。它的性能大大超过了最近最先进的无锚检测器CornerNet,而且更简单。
  • 此外,经过第三节改进的FCOS在单模型和单尺度测试中获得了44.7%的AP,大大超过了以前的探测器。

4.2.区域提案网络的扩展

  • 即使没有提议的中心度分支,FCOS也已经显著改善了AR100和AR1k。
  • 通过建议的中心分支,FCOS将AR100和AR1k分别进一步提高到52.8%和60.3%,与采用FPN的RPN相比,AR100和AR1k的相对改善分别为18%和3.4%。

参考文献

[2019 ICCV][FCOS]FCOS:全卷积一级目标检测FCOS: Fully Convolutional One-Stage Object Detection

目标检测

2014年至2017年:…2018年:[YOLOv3][Cascade R-CNN][MegDet][StairNet][RefineDet][CornerNet][Pelee&PeleeNet]2019年:[DCNv2][重新思考ImageNet预训][GRF-DSOD&GRF-SSD][Centernet][Grid R-CNN][NAS-FPN][ASFF][Bag of Freebies][VoVNet/YOLOv3 Cascade R-CNN MegDet StairNet RefineDet CornerNet Pelee & PeleeNet DCNv2 Rethinking ImageNet Pre-training GRF-DSOD & GRF-SSD CenterNet Grid R-CNN NAS-FPN ASFF Bag of Freebies VoVNet/OSANet FCOS EfficientDet CSPNet YOLOv4 SpineNet Scaled-YOLOv4

我以前的其他论文阅读

原创文章,作者:fendouai,如若转载,请注明出处:https://panchuang.net/2021/09/20/%e2%80%8a-%e2%80%8afcos%e8%bf%b0%e8%af%84%ef%bc%9a%e5%85%a8%e5%8d%b7%e7%a7%af%e5%8d%95%e9%98%b6%e6%ae%b5%e7%9b%ae%e6%a0%87%e6%a3%80%e6%b5%8b/

联系我们

400-800-8888

在线咨询:点击这里给我发消息

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息