博客
关于我
FSAF 让网络自己决定实例输出层
阅读量:260 次
发布时间:2019-03-01

本文共 795 字,大约阅读时间需要 2 分钟。

FSAF 模块简介

全称 Feature Selective Anchor-Free Module (FSAF) 是一种用于目标检测的轻量级模块,主要用于 Pyramid Network (FPN) 中的单阶段检测框架。FSAF 模块通过网络自主选择哪一层来预测目标实例,避免了传统方法中对预设锚框 (anchor) 的依赖。

传统一阶段检测框架的实例选择问题

在传统的单阶段目标检测框架中,实例选择通常基于锚框 IOU (Intersection Over Union) 的比较。具体来说,输入图像经过 FPN 后,会与每个特征图中的锚框计算 IOU,选择 IOU 最大的锚框所在的特征图来预测目标实例。例如,汽车实例与 P4 层的第一个锚框 IOU 最大,因此由 P4 层负责输出。

这种方法虽然简单,但依赖于预设锚框,实质上是基于启发式的经验性选择。这种经验性选择是否最优,如何让网络自主决定实例的分类和偏移,成为一个值得探索的问题。

FSAF 模块的设计与架构

为了解决上述问题,FSAF 模块被引入到 FPN 中。该模块通过在原有的两个分支结构中增加两个小分支,分别负责输出分类和偏移信息。与传统方法不同,FSAF 模块完全不依赖锚框,完全由网络自主决定实例的分类和偏移。

FSAF 模块的实例选择机制

FSAF 模块通过对两个新增加的分支进行训练,分别计算分类损失和回归损失。最终,根据两个损失值的总和来判断哪个分支对应的实例损失最小。例如,在上述示意图中,P3 层的 FSAF 模块对汽车实例的损失最小,因此由 P3 层负责该实例的输出。

总结

FSAF 模块通过轻量级的检测子网络辅助传统锚框检测模块,实现了实例选择的自动化。与传统方法相比,FSAF 模块的选择基于网络学习结果,效果显著优于经验性启发式方法。

参考资料

  • 作者:冷夏LX
  • 作者:ChenJoya
  • 作者:孙杨威

转载地址:http://bvzx.baihongyu.com/

你可能感兴趣的文章
opencv4-图像操作
查看>>
opencv5-图像混合
查看>>
opencv6-调整图像亮度和对比度
查看>>
opencv7-绘制形状和文字
查看>>
opencv8-图像模糊
查看>>
opencv9-膨胀和腐蚀
查看>>
OpenCV_ cv2.imshow()
查看>>
opencv_core.dir/objects.a(vs_version.rc.obj)‘ is incompatible with i386:x86-64 output
查看>>
opencv——图像缩放1(resize)
查看>>
opencv——最简单的视频读取
查看>>
Opencv——模块介绍
查看>>
OpenCV与AI深度学习 | 2024年AI初学者需要掌握的热门技能有哪些?
查看>>
OpenCV与AI深度学习 | CIB-SE-YOLOv8: 优化的YOLOv8, 用于施工现场的安全设备实时检测 !
查看>>
OpenCV与AI深度学习 | CoTracker3:用于卓越点跟踪的最新 AI 模型
查看>>
OpenCV与AI深度学习 | OpenCV中八种不同的目标追踪算法
查看>>
OpenCV与AI深度学习 | OpenCV图像拼接--Stitching detailed使用与参数介绍
查看>>
OpenCV与AI深度学习 | OpenCV如何读取仪表中的指针刻度
查看>>
OpenCV与AI深度学习 | OpenCV常用图像拼接方法(一) :直接拼接
查看>>
OpenCV与AI深度学习 | OpenCV常用图像拼接方法(三):基于特征匹配拼接
查看>>
OpenCV与AI深度学习 | OpenCV常用图像拼接方法(二) :基于模板匹配拼接
查看>>