- 简介在高压力环境下,从语音中检测心理压力至关重要。以往的研究虽然利用声学特征进行压力检测,但大多将压力视为静态标签。在本研究中,我们将压力建模为一种受历史情绪状态影响的、随时间演变的现象。我们提出了一种动态标注策略,通过情绪标签生成细粒度的压力标注,并引入基于交叉注意力机制的序列模型——单向LSTM和Transformer编码器,以捕捉压力随时间发展的过程。我们的方法在MuSE数据集上准确率提升了5%,在StressID数据集上提升了18%,显著优于现有基线模型,并且在自建的真实世界数据集上也表现出良好的泛化能力。这些结果凸显了在语音中将压力建模为动态结构的重要价值。
-
- 图表
- 解决问题论文试图解决在高压力环境下通过语音检测心理压力的问题,且不同于以往将压力视为静态标签的方法,该研究假设压力是随时间动态演变的,并受到历史情绪状态影响。这一动态建模视角为压力识别领域带来了新的挑战和研究方向,虽然压力检测本身不是新问题,但将其建模为时序演化过程具有新颖性。
- 关键思路提出一种动态标注策略,从情绪标签中推导细粒度的压力标注,并引入基于交叉注意力的序列模型(如单向LSTM和Transformer Encoder)来捕捉压力随时间的演变过程。相比传统静态分类方法,该方法首次显式建模压力的时序依赖性和情绪历史的影响,显著提升了性能。
- 其它亮点在MuSE和StressID数据集上分别实现了+5%和+18%的准确率提升,并在自建的真实世界数据集上表现出良好的泛化能力;实验设计充分验证了时序建模的有效性;使用情绪到压力的映射进行动态标注,为缺乏精细压力标注的数据集提供了可行方案;代码是否开源未明确提及,但方法框架清晰,值得进一步探索其在医疗、人机交互等场景中的应用。
- 1. Emotion-aware Speech Recognition Using Temporal Context Modeling 2. Dynamic Emotion Tracking in Speech with Transformer-based Sequence Models 3. Multimodal Stress Detection Using Physiological and Acoustic Cues 4. Speech-Based Stress Detection: A Deep Learning Approach with Data Augmentation 5. The MuSE Challenge: Multimodal Sentiment and Emotion Analysis in Real-World Environments
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流