- 简介本文提出了一种解决多标签音频分类任务序列中潜在重叠声音的增量学习方法。我们设计了一个增量学习器,可以独立地学习新的类别,以保留关于旧类别的知识,我们提出了一种基于余弦相似度的蒸馏损失,用于最小化后续学习器的特征表示中的差异,并与基于Kullback-Leibler散度的蒸馏损失一起使用,以最小化它们各自的输出中的差异。实验在一个包含50个声音类别的数据集上进行,包括30个基础类别和4个增量阶段,每个阶段包含5个类别。每个阶段后,系统都会使用到目前为止学习到的所有类别进行多标签分类测试。所提出的方法在五个阶段中获得了平均F1得分为40.9%,从30个类别的第0阶段的45.2%到50个类别的第4阶段的36.3%不等。增量阶段的平均性能下降仅为0.7个百分点,从初始的45.2%的F1得分。
- 图表
- 解决问题论文提出了一种解决多标签音频分类任务中潜在重叠声音的类增量学习方法。该方法旨在保留旧类别的知识,同时独立地学习新类别。
- 关键思路论文提出了一种基于余弦相似度的蒸馏损失和基于KL散度的蒸馏损失相结合的增量学习方法,用于最小化后续学习器之间的特征表示差异和输出差异。
- 其它亮点论文在50个声音类别的数据集上进行了实验,包含30个基本类别和4个每个5个类别的增量学习阶段。实验结果表明,该方法在五个阶段的平均F1得分为40.9%,与初始F1得分的平均性能降级仅为0.7个百分点。
- 在相关研究方面,最近的一些研究包括:《Incremental Learning for Deep Multiple Instance Classification》、《Class-Incremental Learning via Deep Model Consolidation》等。
沙发等你来抢
去评论
评论
沙发等你来抢