- 简介自动图像裁剪模型可以预测重新定位框来提高图像的美感。然而,标注数据的稀缺性阻碍了这项任务的进展。为了克服这个限制,我们探索了利用标注和未标注数据一起扩大图像裁剪模型训练数据规模的可能性。这个想法可以用伪标签的方式来实现:由教师模型为未标注数据生成伪标签,并用这些伪标签训练学生模型。然而,学生可能会从教师的错误中学习。为了解决这个问题,我们提出了多策略视野网络(MPV-Net),它提供了多种不同的优化策略来纠正教师原始伪标签中的错误。最可靠的策略被选中来生成可信的伪标签。策略的可靠性是通过对抗框抖动的鲁棒性来评估的。我们的方法的有效性可以通过与仅使用标注数据的监督基线相比的改进来评估。值得注意的是,我们的MPV-Net优于现成的伪标签方法,相比监督基线获得了最实质性的改进。此外,我们的方法在FCDB和FLMS数据集上取得了最先进的结果,表明了我们方法的优越性。
- 图表
- 解决问题解决问题的是利用有标签和无标签数据来扩展图像裁剪模型的训练数据规模,以提高模型性能。
- 关键思路通过利用带有伪标签的无标签数据来训练学生模型,同时使用多种策略来纠正教师模型的错误,以生成可信的伪标签。
- 其它亮点论文使用了多种数据集进行实验,并且提出的方法在FCDB和FLMS数据集上取得了最先进的结果。同时,论文的方法也优于现有的伪标签方法。
- 在最近的相关研究中,还有一些关于图像裁剪的研究,如"AutoCrop: An Automatic Cropping Algorithm for Still Images"和"Unsupervised Image Cropping Using Deep Convolutional Neural Networks"等。
沙发等你来抢
去评论
评论
沙发等你来抢