- 简介昆虫是全球生物多样性的一半,然而世界上许多昆虫正在消失,这对生态系统和农业有着严重的影响。尽管如此,由于人类专家稀缺和缺乏可扩展的监测工具,关于昆虫多样性和数量的数据仍然极为不足。生态学家已经开始采用相机陷阱记录和研究昆虫,并提出计算机视觉算法作为可扩展数据处理的答案。然而,野外昆虫监测面临着计算机视觉尚未解决的独特挑战,包括长尾数据、极其相似的类别和显著的分布变化。我们提供了第一个大规模机器学习基准,用于细粒度昆虫识别,旨在匹配生态学家面临的实际任务。我们的贡献包括一个由公民科学平台和博物馆提供的图像数据集,以及一个由自动相机陷阱在多个大陆上收集的专家注释数据集,旨在测试在野外条件下的分布外泛化。我们训练和评估了各种基准算法,并引入了一种数据增强技术的组合,以增强地理和硬件设置的泛化能力。代码和数据集已公开发布。
- 图表
- 解决问题解决问题:论文旨在解决昆虫监测中的数据处理问题,包括长尾数据、类别相似度高和分布偏移等挑战。同时提供大规模机器学习基准测试,以匹配生态学家在野外面临的真实任务。
- 关键思路关键思路:论文提出了一个基于计算机视觉的方案,利用摄像机捕捉昆虫图像并使用机器学习算法进行分类和识别,同时采用数据增强技术来提高模型的泛化能力。
- 其它亮点亮点:论文提供了两个数据集,一个是从公民科学平台和博物馆中筛选的图像数据集,另一个是从自动化摄像机陷阱中收集的数据集,用于测试模型在野外环境下的泛化能力。论文还介绍了一些数据增强技术,包括数据旋转、裁剪和缩放等方法。作者还公开了代码和数据集。
- 相关研究:最近的相关研究包括使用计算机视觉技术监测动物种群数量的研究。例如,"Camera Traps in Animal Ecology: Methods and Analyses"和"Deep Learning for Ecology"等论文。
沙发等你来抢
去评论
评论
沙发等你来抢