ICLR 2023 | H2RBox: 旋转目标检测方法

这是一篇弱监督+自监督的旋转目标检测方法解读，性能比肩全监督的方法。

论文地址：https://arxiv.org/abs/2210.06742

PyTorch代码：https://github.com/yangxue0827/h2rbox-mmrotate

相比通用目标检测（水平框检测），旋转检测的研究兴起较晚。以我熟悉的遥感图像旋转检测为例（场景文字相关的旋转检测出现地更早），我是在 17 年末（国科大研二才进实验室）开始做旋转舰船检测的，当时几乎还找不到相关的研究，大部分还是水平框检测算法（如 Faster RCNN、SSD 等）在遥感图像的应用。旋转框标注的数据集也很少，当时做旋转舰船检测还是举实验室之力标注了一个。

从水平框检测发展到旋转检测的这段时间里，很多数据集以水平框标注的形式发布，如果现在想进一步用于旋转检测，似乎只有重新标注。如果数据集量小还好说，一旦实例数达到十万甚至百万级别，所需要花的人力物力是非常大的。比如，DIOR（19.2w 个实例）数据集刚发布的时候是以水平框标注，后来又重新标注了旋转框；SKU110K（173.3w 个实例）数据集也是在后来有了一个旋转标注版本。

于是乎，我们想到了这样一个的研究任务：水平框标注的旋转框目标检测。这算是一个弱监督检测任务（也不是很“弱”），就我目前所知好像还没有人做这个事情，算是一个小坑，感兴趣的同学赶紧入坑。如果效果比肩旋转框标注的话，就可以不用重新标注旋转框；即使效果一般般，起码也可以辅助标注旋转框。后来我们查了一下各种标注形式的价格，旋转框每一千个是 86 刀，比水平框高的 63 刀高 36.5% 的价格。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

ICLR 2023 | H2RBox: 旋转目标检测方法

评论