本文在YOLOv5的基础上加入了一些新的技术,比如ViT、CBAM和一些Tricks(数据增广、多尺度测试等),命名为TPH-YOLOv5的目标检测器,比较适合无人机小目标的检测和应用。

作者单位 北京航空航天大学

论文链接:https://arxiv.org/abs/2108.11539

本文的贡献如下:

  • 增加了一个预测头来处理目标的大尺度方差;
  • 将Transformer Prediction Heads (TPH)集成到YOLOv5中,可以在高密度场景中准确定位目标;
  • 将CBAM集成到YOLOv5中,帮助网络在区域覆盖范围大的图像中找到感兴趣的区域;
  • 提供有用的Tricks,并过滤一些无用的Trick,用于无人机捕获场景的目标检测任务;
  • 使用self-trained classifier来提高对一些容易混淆的类别的分类能力。

图 THP-YOLOv5整体架构

内容中包含的图片若涉及版权问题,请及时与我们联系删除