Tile Compression and Embeddings for Multi-Label Classification in GeoLifeCLEF 2024

2024年07月08日
  • 简介
    我们探索了解决GeoLifeCLEF 2024竞赛中由DS@GT团队提出的多标签分类任务的方法,该任务旨在使用空间和时间遥感数据预测特定位置植物物种的存在和缺失。我们的方法使用离散余弦变换(DCT)通过频域系数对原始输入数据进行压缩和预计算,以供卷积神经网络使用。我们还通过局部敏感哈希(LSH)研究了最近邻居模型,以用于预测并通过tile2vec辅助自监督对比学习嵌入。我们最好的竞赛模型利用地理位置特征,排行榜得分为0.152,最佳后竞赛得分为0.161。源代码和模型可在https://github.com/dsgt-kaggle-clef/geolifeclef-2024上获得。
  • 作者讲解
  • 图表
  • 解决问题
    解决问题:GeoLifeCLEF 2024竞赛中的多标签分类任务,利用空间和时间遥感数据预测植物物种的存在和缺失。
  • 关键思路
    关键思路:利用离散余弦变换(DCT)的频域系数对原始输入数据进行压缩和预计算,用于卷积神经网络。通过局部敏感哈希(LSH)的最近邻模型进行预测,以及通过tile2vec辅助自监督对比学习嵌入。最佳模型使用地理位置特征,得分为0.152。
  • 其它亮点
    亮点:使用DCT和LSH进行预处理和预测,使用tile2vec进行自监督对比学习嵌入。提供源代码和模型,可在https://github.com/dsgt-kaggle-clef/geolifeclef-2024上获取。值得进一步研究的工作包括利用更多的地理信息和改进模型的性能。
  • 相关研究
    相关研究:最近的相关研究包括使用卷积神经网络和遥感数据进行植被分类的研究,如“Remote Sensing Image Scene Classification Using Convolutional Neural Networks”和“Deep Learning for Remote Sensing Data: A Technical Tutorial on the State of the Art”。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问