由于在经过多层的前向卷积运算之后,输出的特征图将变得比较小,则特征图上的一个像素点便对应着原图中较大的区域,这样的结构就很难检测较小物体。因此SSD就将中间过程输出的特征图也用来做回归和分类,可以看成一个多尺度检测的过程,保证了空间尺度上的完备性,可以有效检测出较小的物体。
SSD主要是加入卷积特征层,得到不同尺度的特征层,从而实现多尺度目标检测。对于每个添加的特征层,使用一组卷积滤波器,可以得到一组固定数目的目标检测的预测 。
SSD 方法获取目标位置和类别的机理跟YOLO方法一样,都是使用回归,但是YOLO对小目标检测效果不好,而SSD则在不同的feature map上分割成grid然后去做回归,效果会好一点。
参考:
SSD(single shot multibox detector)算法及Caffe代码详解
https://zhuanlan.zhihu.com/ML-Algorithm (知乎大佬,膜拜中)