- 简介本文介绍了两种方法来提高基于Fisher信息的BAIT主动学习策略的计算效率和可扩展性。BAIT已经在各种数据集上展示了出色的性能,但其高计算和内存需求限制了其在大规模分类任务中的适用性,导致当前研究忽略了BAIT的评估。本文通过近似Fisher信息,显著降低了时间复杂度。特别地,我们通过i)对最可能的类别进行期望和ii)构建二分类任务,从而得到了梯度计算的替代似然,改进了原始公式。因此,这使得BAIT可以在包括ImageNet在内的大规模数据集上高效使用。我们在各种数据集上进行了统一和全面的评估,证明了我们的近似方法在显著降低时间复杂度的同时,实现了强大的性能。此外,我们提供了一个广泛的开源工具箱,实现了最新的主动学习策略,可在https://github.com/dhuseljic/dal-toolbox上获得。
- 图表
- 解决问题提高Deep active learning (AL)方法在大规模数据集上的计算效率和可扩展性。
- 关键思路通过对Fisher Information的近似计算,降低了BAIT方法的时间复杂度,使其可以在大规模数据集上高效使用。
- 其它亮点论文提出了两种方法来提高BAIT方法的计算效率和可扩展性,通过实验验证了这些方法的有效性,并提供了一个开源工具箱。
- 近期相关研究包括:Active Learning Survey、Deep Active Learning Using Multiple Uncertainty Sampling等。
沙发等你来抢
去评论
评论
沙发等你来抢