稀疏R-CNN:具有可学习建议的端到端目标检测

作者: | Peize Sun | Rufeng Zhang | Yi Jiang | Tao Kong | Chenfeng Xu | Wei Zhan | Masayoshi Tomizuka | Lei LI | Zehuan Yuan | Changhu Wang | Ping Luo |

摘要:提出了一种纯稀疏的图像目标检测方法--稀疏R-CNN。现有的目标检测工作严重依赖于密集的候选目标,例如在所有H×W大小的图像特征图网格上预先定义的k个锚盒。然而,在我们的方法中,向目标识别头提供一个总长度为N的固定稀疏的学习目标建议集来进行分类和定位。通过消除HWK(多达数十万)手动设计的候选对象到N(例如100)个可学习的建议,稀疏R-CNN完全避免了与候选对象设计和多对一标签分配相关的所有工作。更重要的是,最终预测是直接输出的,没有后处理的非最大值抑制。稀疏R-CNN在具有挑战性的COCO数据集上展示了与完善的检测器基线相当的准确性、运行时间和训练收敛性能,例如,在标准的3×训练时间表中达到44.5AP,使用ResNet-50 FPN模型以22fps的速度运行。我们希望我们的工作能启发我们重新思考物体探测器中稠密先验的惯例。代码可从以下网址获得:https://github.com/PeizeSun/SparseR-CNN.

论文地址

https://arxiv.org/abs/2011.12450v1

下载地址

https://arxiv.org/pdf/2011.12450v1.pdf

全部源码

https://github.com/PeizeSun/SparseR-CNN 类型: pytorch

https://github.com/liangheming/sparse_rcnnv1 类型: pytorch

目标检测目标识别

相关推荐

暂无评论

微信扫一扫,分享到朋友圈

稀疏R-CNN:具有可学习建议的端到端目标检测