本文对西安大略大学的移动设备实时目标检测系统Pelee&PeleeNet(Pelee&PeleeNet)进行了评介,介绍了Pelee:a Real-time object Detection system on Mobile Devices(Pelee&PeleeNet)。在本文中:
- PeleeNet是仅使用传统卷积的PeleeNet,它是DenseNet架构的变种,适用于移动设备。
- Pelee以PeleeNet为主干,改进型SSD为目标检测网络,成为一种快速的目标检测器。(IT?™和YOLO目标检测网络一样,都是以暗网为骨干。)
这是2018年NeurIPS上的一篇论文,被引用超过200次。(曾锡豪@Medium)Sik-Ho Tsang
大纲
- 在PeleeNet中修改了DenseNet的多个位置。
1.1.双向致密层
- 在GoogLeNet的推动下,一个双向的致密层,可以获得不同尺度的接受场,如上所述。
- 该层的一种方式使用3?-3内核大小。
- 该层的另一种方式使用两个堆叠的3?3卷曲来学习大型对象的视觉图案。
1.2.茎挡路
- 在盗梦空间v4和数字超氧化物歧化酶的启发下,在第一致密层之前设计了一个性价比高的茎挡路,如上所述。
- 该主干挡路可以在不增加过多计算量的情况下有效提高特征表达能力。
1.3.瓶颈层的动态通道数
- 在DenseNet中,对于前几个密集层,瓶颈通道的数量远远大于其输入通道的数量,这意味着对于这些层来说,瓶颈层增加了计算成本,而不是降低了成本。
- 为了保持架构的一致性,所有密集层仍增加了瓶颈层,但根据输入形状动态调整数量,保证通道数量不超过输入通道。
- 实验表明,与原DenseNet结构相比,该方法在对准确率影响不大的情况下,可以节省高达28.5%的计算代价。
1.4.不带压缩的过渡层
- DenseNet提出的压缩因子有损于特征表达。
- 输出通道的数量始终与过渡层中的输入通道数量相同。
1.5.复合函数
- 在DenseNet中使用后激活(Conv-BN-RELU)代替预激活。
- 在这种情况下,可以在推理阶段将BN与卷积层合并,大大提高了速度。
- 为了补偿这一变化对精度的负面影响,当使用浅而宽的网络结构时,在最后一个密集的挡路之后增加一个1?1卷积层,以获得更强的表示能力。
- PeleeNet中修改了SSD的多个位置。
2.1.要素地图选择
- 精心挑选的5幅比例尺特征地图(19-19、10-10、5-5、3-3和1-1)。
- 为了减少计算量,我们没有使用38°-38特征映射。
2.2.残差预测挡路
- 对于每个用于检测的特征地图,在进行预测之前建立残差挡路(ResBlock)。
2.3.用于预测的小卷积核
- 残差预测挡路使得应用1-1卷积核来预测类别分数和盒偏移量成为可能。
- 实验表明,使用1-1个核函数的模型精度与使用3-3个核函数的模型精度几乎相同。
- 然而,1µ-1核函数使计算量减少了21.5%。
3.PeleeNet:网络架构
- 整个网络由一个主干挡路和四级特征提取器组成。
- 除最后一级外,每一级的最后一层均为步长为2的平均汇集层。
- 前两级中的层数被特别控制在可接受的范围内。
4.PeleeNet:消融研究
- 根据斯坦福狗使用的ImageNet,ILSVRC 2012的子集。这些图像是狗的品种的图像。训练数据和验证数据均精确复制自ILSVRC 2012数据集。
- 类别数量:120个
- 训练图像数量:150466张
- 验证图像数量:6000张
- 一个叫做DenseNet-41的类似DenseNet的网络被用作基线。该模型与最初的DenseNet有两个不同之处:
- 综合所有设计方案后,PeleeNet在Stanford Dog上的准确率达到79.25%,比DenseNet-41的准确率高4.23%,而且计算量更小。
5.图像分类结果
5.1.ImageNet
- 与MobileNetV1和ShuffleNet V1相比,PeleeNet在模型大小不超过66%的情况下具有更高的精度和更低的计算量。
- PeleeNet的模型尺寸仅为VGG16的1/49。
- 在TX2上,PeleeNet比MoibleNetV1和MobileNetV2快得多。
- 使用半精度浮点(FP16),PeleeNet在FP16模式下的运行速度是FP32模式下的1.8倍。
- 相比之下,使用深度可分离卷积构建的网络很难从TX2半精度(FP16)推理机中获益。运行在FP16模式下的MobileNetV1和MobileNetV2与运行在FP32模式下的速度几乎相同。
5.3.iPhone 8的速度
- 同样,PeleeNet以较小的模型尺寸获得了较高的精度。
6.1.各种设计选择的效果
- 有残差预测挡路的模型比没有残差预测挡路的模型准确率高出2.2个百分点。
- 用1?-1核进行预测的模型精度与用3?-3核预测的模型的精度基本相同。而1µ-1核函数的计算量减少了21.5%,模型尺寸减少了33.9%。
6.2.帕斯卡VOC 2007
- Pelee的准确率比TinyYOLOv2高13.8%,比SSD+MobileNetV1高2.9%。
- 它甚至比YOLOv2âuro“288”的计算成本更高,仅为YOLOv2âuro“288的计算成本的14.5%。
- 当我们按照第3.3节所述在COCO traval35k上训练的模型并在07+12数据集上进行微调时,Pelee获得了76.4%的MAP。
6.3.真实设备上的速度
- 虽然残差预测挡路在Pelee中的使用增加了计算成本,但Pelee仍然比iphone上的固态硬盘+MobileNetV1和fp32模式下的TX2运行得更快。
- 此外,与FP16模式下的SSD+MobileNetV1和SSDLite+MobileNetV2相比,Pelee具有更大的速度优势。
- 我们建议的目标检测系统Pelee在iPhone8上可以运行23.6FPS,在NVIDIA TX2上可以高精度运行125FPS。
6.4.可可
- Pelee不仅比SSD+MobileNetV1更准确,在MAP@[0.5:0.95]和MAP@0.75上都比YOLOv2更准确。
- 同时,Pelee的速度是YOLOv2的3.7倍,模型尺寸是YOLOv2的11.3倍。
参考文献
[2018 NeurIPS][Pelee&PeleeNet]Pelee:一种移动设备上的实时目标检测系统Pelee: A Real-Time Object Detection System on Mobile Devices
图像分类
µ2018年:[ROR][DMRNet/DFN-MR][MSDNet][ShuffleNet V1][Senet][Nasnet][MobileNetV2][CondenseNet][IGCV2][IGCV3][Fish net][SqueezeNext][ENAS][PNASNet][ShuffleNet V2][BAM][CBAM][MorphNet][NetAdapt][[ESPNetv2][MnasNet][单路径NAS][DARTS][ProxylessNAS][MobileNetV3][FBNet][ShakeDrop][CutMix][MixConv][EfficientNet][ABN][SKNet][CB Lost][AutoAugment,AA]2020:[随机擦除(RE)][SAOL][AdderNet]2021:[学习Resizer]RoR DMRNet / DFN-MR MSDNet ShuffleNet V1 SENet NASNet MobileNetV2 CondenseNet IGCV2 IGCV3 FishNet SqueezeNext ENAS PNASNet ShuffleNet V2 BAM CBAM MorphNet NetAdapt mixup DropBlock Group Norm (GN) Pelee & PeleeNet ResNet-38 AmoebaNet ESPNetv2 MnasNet Single-Path NAS DARTS ProxylessNAS MobileNetV3 FBNet ShakeDrop CutMix MixConv EfficientNet ABN SKNet CB Loss AutoAugment, AA Random Erasing (RE) SAOL AdderNet Learned Resizer
目标检测
»2018年:[YOLOv3][Cascade R-CNN][MegDet][StairNet][RefineDet][CornerNet][Pelee&PeleeNet]2019年:[DCNv2][重新思考ImageNet预训][GRF-DSOD&GRF-SSD][Centernet][Grid R-CNN][NAS-FPN][ASFF]2020:[EfficientDetYOLOv3 Cascade R-CNN MegDet StairNet RefineDet CornerNet Pelee & PeleeNet DCNv2 Rethinking ImageNet Pre-training GRF-DSOD & GRF-SSD CenterNet Grid R-CNN NAS-FPN ASFF EfficientDet
我以前的其他论文阅读
原创文章,作者:fendouai,如若转载,请注明出处:https://panchuang.net/2021/08/09/review%e2%80%8a-%e2%80%8apelee%ef%bc%9a%e4%b8%80%e7%a7%8d%e7%a7%bb%e5%8a%a8%e8%ae%be%e5%a4%87%e4%b8%8a%e7%9a%84%e5%ae%9e%e6%97%b6%e7%9b%ae%e6%a0%87%e6%a3%80%e6%b5%8b%e7%b3%bb%e7%bb%9f-2/