AI人工智能

时间：2022-11-22

　　R-CNN算法的思路非常简单，首先基于Selective Search方法从原始图像中筛选出若干候选框，然后将每个候选框中的图像缩放的固定尺度送入卷积网络提取特征，最后通过支持向量机（SVM）方法对特征进行分类，判断候选框中的图像是背景还是我们关注的目标类型。

　　1、SPP-Net算法基于一个空间金字塔池化层（SPP layer），无论输入的子图像大小如何，都会将子图像采样成固定大小的图像。

　　2、Fast R-CNN算法，其本质是在R-CNN和SPP-Net的基础上进行了进一步改进。Fast R-CNN可以在网络里同时预测目标的分类概率和位置偏移。Faster R-CNN算法，Faster R-CNN是第一个端到端算法，也是第一个接近实时深度学习的目标检测算法。使用ZF-Net网络骨架，在VOC2007数据集上，mAP达到了73.2%，算法速度达到了17fps。

　　3、绝大多数深度学习检测器都是基于卷积网络最顶层的特征图进行计算的。深层特征包含全局信息，却弱化了细节信息，使用深层特征在小目标检测，尤其是精准定位方面，有着较大的劣势。FPN采用top-down结构以及侧连方法，将深层特征和浅层特征进行融合，使得特征既包含全局信息又包含细节信息。

　　4、FCOS（Fully Convolutional One-Stage）算法。和SSD等一阶段算法不同，FCOS是一种“anchor free”方法，回归目标位置不需要预先设定anchor，在待检测目标尺度和形态变化较大的场景中有重要的应用。另外，FCOS算法在具体实现的过程中也使用了FPN策略，对于多尺度的目标有更好的检测效果。

　　举报/反馈