Emotional Voice Messages (EMOVOME) database: emotion recognition in spontaneous voice messages

2024年02月27日
  • 简介
    Emotional Voice Messages (EMOVOME)是一个自发语音数据集,包含来自100名西班牙说话者(男女平衡)在信息应用程序上的真实对话中的999个音频消息。参与者在被招募之前在野外环境下产生语音消息,避免了由于实验室环境而产生的任何意识偏见。三个非专家和两个专家对音频进行了情感价值和唤起度标记,然后将其组合以获得每个维度的最终标签。专家还提供了与七种情绪类别相对应的额外标签。为了为使用EMOVOME进行未来研究设定基线,我们使用语音和音频转录实施了情感识别模型。对于语音,我们使用了标准的eGeMAPS特征集和支持向量机,在情感价值和唤起度方面分别获得49.27%和44.71%的非加权准确度。对于文本,我们微调了一个多语言BERT模型,并分别获得了61.15%和47.43%的非加权准确度。该数据库将显著促进野外情感识别研究,同时为西班牙语提供了独特的自然和免费资源。
  • 作者讲解
  • 图表
  • 解决问题
    论文旨在解决在野外语音情感识别中的问题,提供一个自然且免费的西班牙语资源。
  • 关键思路
    论文提出了使用eGeMAPS特征集和支持向量机进行语音情感识别的方法,并使用多语言BERT模型进行文本情感识别,为未来的情感识别研究提供了基准。
  • 其它亮点
    EMOVOME是一个自然的、免费的西班牙语语音数据集,标注了情感维度和情感类别。使用了两种方法进行情感识别,并比较了它们的效果。该数据集为未来的情感识别研究提供了重要的贡献。
  • 相关研究
    最近的相关研究包括使用深度学习方法进行情感识别、使用多模态数据进行情感识别等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问