【论文标题】LSSED: a large-scale dataset and benchmark for speech emotion recognition 【作者团队】Weiquan Fan, Xiangmin Xu, Xiaofen Xing, Weidong Chen, Dongyan Huang 【发表时间】2020/02/03 【机 构】南方科技大学 【论文链接】https://arxiv.org/abs/2102.01754

【推荐理由】 在本文中,作者介绍了LSSED,这是一个具有挑战性的大规模英语语音情感数据集,该数据集具有从820个主题中收集的数据以模拟现实世界的分布。 语音情感识别是下一代人机交互(HCI)的重要贡献。 但是,当前现有的小型数据库限制了相关研究的发展。 在本文中,作者介绍了LSSED,这是一个具有挑战性的大规模英语语音情感数据集,该数据集具有从820个主题中收集的数据以模拟现实世界的分布。 此外,作者发布了一些基于LSSED的预训练模型,这些模型不仅可以促进语音情感识别的发展,而且可以转移到相关的下游任务,例如难以收集数据的心理健康分析。 最后,作者的实验表明了大规模数据集的必要性和预训练模型的有效性

内容中包含的图片若涉及版权问题,请及时与我们联系删除