Characterizing Continual Learning Scenarios and Strategies for Audio Analysis

2024年06月29日
  • 简介
    音频分析在许多应用场景中都非常有用。目前最先进的音频分析方法假设训练和部署时的数据分布是相同的。然而,由于各种现实环境因素的影响,数据可能会在其分布上遇到漂移或在未来出现新的类别。因此,一次性训练的模型可能无法表现出足够的性能。本文描述了用于解决由于漂移而导致的灾难性遗忘的音频分析中的连续学习(CL)方法。由于没有针对音频分析的CL数据集,我们使用DCASE 2020到2023数据集创建了各种基于音频的监测任务的CL场景。我们研究了以下CL和非CL方法:EWC、LwF、SI、GEM、A-GEM、GDumb、Replay、Naive、累积和联合训练。这项研究对于从事音频分析领域的研究人员和实践者开发自适应模型非常有益。我们观察到,在DCASE挑战数据中,Replay方法比其他方法取得了更好的结果。它在域增量场景下实现了70.12%的准确率,在类增量场景下实现了96.98%的准确率。
  • 图表
  • 解决问题
    本文旨在解决音频分析中数据分布漂移和新类别出现所带来的灾难性遗忘问题,探究持续学习在音频分析中的应用。
  • 关键思路
    本文使用DCASE 2020到2023数据集创建不同的持续学习场景,研究了EWC、LwF、SI、GEM、A-GEM、GDumb、Replay、Naive、cumulative和joint training等方法,其中Replay表现最好。
  • 其它亮点
    本文实验设计严谨,使用了公开数据集,探究了多种持续学习方法在音频分析中的应用,为音频分析领域的研究和实践提供了有价值的参考。
  • 相关研究
    近年来,音频分析领域的持续学习相关研究有:Continual Learning for Audio Event Detection Using Knowledge Distillation and Online Data Selection、Continual Learning for Acoustic Scene Classification Using Knowledge Distillation和Continual Learning in Audio Classification: Incremental Learning Approaches等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论