Transfer Learning for Passive Sonar Classification using Pre-trained Audio and ImageNet Models

2024年09月20日
  • 简介
    传递学习通常用于利用大型预训练模型,并对下游任务进行微调。最常见的预训练模型最初是使用ImageNet进行训练的。然而,它们的泛化能力在不同的数据模态下可能会有所不同。本研究比较了在水下声学目标识别(UATR)背景下预训练的音频神经网络(PANNs)和ImageNet预训练模型。观察到在被动声纳分类中,ImageNet预训练模型略优于预训练音频模型。我们还分析了音频采样率对模型预训练和微调的影响。本研究有助于UATR的传递学习应用,展示了预训练模型解决UATR领域稀缺标记数据所带来的限制的潜力。
  • 图表
  • 解决问题
    本论文旨在比较使用ImageNet预训练模型和使用预训练音频模型在水下声学目标识别中的性能差异,并分析音频采样率对预训练和微调的影响。
  • 关键思路
    通过比较使用不同预训练模型的性能,探究在水下声学目标识别领域中使用预训练模型的可行性,以解决数据稀缺的问题。
  • 其它亮点
    实验结果表明,在被动声纳分类中,ImageNet预训练模型略优于预训练音频模型。此外,研究还分析了音频采样率对模型预训练和微调的影响。本研究为UATR的转移学习应用做出了贡献,展示了预训练模型解决UATR领域稀缺标记数据的潜力。
  • 相关研究
    在此领域的相关研究中,近期的论文有《A Comprehensive Survey of Deep Learning for Image Captioning》、《A Survey on Deep Learning in Medical Image Analysis》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论