- 简介优化深度学习模型需要大量的标注图像,这是一个耗时和昂贵的过程,特别是对于需要对每个像素进行注释的语义分割模型。减少注释工作量的一个潜在策略是主动学习。主动学习有助于从大量未标记的图像库中识别和选择最具信息量的图像。其基本前提是,这些被选择的图像可以比随机选择更快地提高模型的性能,从而减少注释工作量。虽然主动学习在像Cityscapes这样的基准数据集上表现出有希望的结果,但它在农业领域的表现仍然未被充分探索。本研究通过对三种基于主动学习的采集函数(Bayesian Active Learning by Disagreement(BALD)、基于随机的BALD(PowerBALD)和随机采样)进行比较研究,填补了这一研究空白。这些采集函数在两个农业数据集(Sugarbeet和Corn-Weed)上进行了测试,这两个数据集都包含三个语义类别:背景、作物和杂草。研究结果表明,主动学习,特别是PowerBALD,在两个数据集上的表现均优于随机采样。但由于标准偏差相对较大,所观察到的差异很小;这部分是由于图像冗余和类别不平衡造成的。具体而言,两个数据集中超过89%的像素属于背景类别。两个数据集上未观察到显著结果,这表明需要进一步研究如何在农业数据集上应用主动学习,特别是对于具有高度类别不平衡和冗余图像的数据集。本文提供了建议和见解,以潜在地解决这些问题。
-
- 图表
- 解决问题本文旨在探讨在农业领域中应用主动学习的可行性,特别是针对存在高类别不平衡和冗余图像的情况,以及比较三种基于主动学习的获取函数的性能。
- 关键思路本文提出了一种利用主动学习来减少标注时间和成本的方法,通过从大量未标注的图像中选择最具信息量的图像来改善模型性能,尤其是使用PowerBALD获取函数可以在Sugarbeet和Corn-Weed两个农业数据集上提高模型性能。
- 其它亮点本文在Sugarbeet和Corn-Weed两个农业数据集上进行了实验,比较了三种获取函数的性能,发现使用PowerBALD获取函数可以提高模型性能。然而,由于高冗余和不平衡的类别,实验结果差异很小。本文提供了一些建议和见解,以解决此类问题。
- 最近的相关研究主要集中在基于主动学习的图像分割和分类,如Cityscapes数据集。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流