Dynamic Stress Detection: A Study of Temporal Progression Modelling of Stress in Speech

向作者提问

NEW

简介

在高压力环境下，从语音中检测心理压力至关重要。以往的研究虽然利用声学特征进行压力检测，但大多将压力视为静态标签。在本研究中，我们将压力建模为一种受历史情绪状态影响的、随时间演变的现象。我们提出了一种动态标注策略，通过情绪标签生成细粒度的压力标注，并引入基于交叉注意力机制的序列模型——单向LSTM和Transformer编码器，以捕捉压力随时间发展的过程。我们的方法在MuSE数据集上准确率提升了5%，在StressID数据集上提升了18%，显著优于现有基线模型，并且在自建的真实世界数据集上也表现出良好的泛化能力。这些结果凸显了在语音中将压力建模为动态结构的重要价值。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

论文试图解决在高压力环境下通过语音检测心理压力的问题，且不同于以往将压力视为静态标签的方法，该研究假设压力是随时间动态演变的，并受到历史情绪状态影响。这一动态建模视角为压力识别领域带来了新的挑战和研究方向，虽然压力检测本身不是新问题，但将其建模为时序演化过程具有新颖性。
关键思路

提出一种动态标注策略，从情绪标签中推导细粒度的压力标注，并引入基于交叉注意力的序列模型（如单向LSTM和Transformer Encoder）来捕捉压力随时间的演变过程。相比传统静态分类方法，该方法首次显式建模压力的时序依赖性和情绪历史的影响，显著提升了性能。
其它亮点

在MuSE和StressID数据集上分别实现了+5%和+18%的准确率提升，并在自建的真实世界数据集上表现出良好的泛化能力；实验设计充分验证了时序建模的有效性；使用情绪到压力的映射进行动态标注，为缺乏精细压力标注的数据集提供了可行方案；代码是否开源未明确提及，但方法框架清晰，值得进一步探索其在医疗、人机交互等场景中的应用。
相关研究

1. Emotion-aware Speech Recognition Using Temporal Context Modeling 2. Dynamic Emotion Tracking in Speech with Transformer-based Sequence Models 3. Multimodal Stress Detection Using Physiological and Acoustic Cues 4. Speech-Based Stress Detection: A Deep Learning Approach with Data Augmentation 5. The MuSE Challenge: Multimodal Sentiment and Emotion Analysis in Real-World Environments

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问