随着疫情对公众心理健康造成了一系列负面影响,抑郁症正在成为一种社会性心理问题。全球有10亿人正在受到精神心理问题的困扰,其中抑郁症是非致命健康损失的最大诱因之一。此外,到了2030年,抑郁症将会成为全球第一大疾病负担。

传统的抑郁症诊断是通过受过专业培训的精神科医生对患者进行访谈和观察,根据诊断标准评估患者是否患有抑郁症。而在国内,精神科医生的短缺使得有效识别抑郁症变得更加困难。这一诊断方式导致了:患者对症状严重程度的不自知、隐瞒病情等问题,经常会混淆诊断。而研究表明,成功的抑郁症筛查和监测可以提供更早的诊断和更精细的治疗,这可能有助于改善严重抑郁症的预后。

图片

近年来,基于移动端的AI技术和可穿戴设备,对生理和心理数据进行无创和连续监测产生了巨大的作用。同时,语义识别、机器翻译等技术也已经逐渐成熟。声学和语音命令处理方面的进步,使得机器学习成为了健康诊断的新兴领域。

语音的产生是一个复杂的神经肌肉协调过程。肺部气流经由声门带动声带震动,并通过声道的共鸣、谐振从而发出声音。语音中携带了声学、语言、情感等复杂信息。几十年来的过往研究表明,抑郁症患者在语言方面会表现出重音减轻、单调、响度衰减等现象,这些是由抑郁症造成的实质性改变引起的。

目前,一系列声学特征已被确定为抑郁症的预测因素,例如语音中的声源特征、频谱及韵律特征等。机器学习能够从语音中捕获人耳很难甚至无法感知但客观存在的声学特征变化,这一语音技术也在检测抑郁症等精神障碍方面表现出了可观的潜力。

回归到国内研究领域,2019年开始,北京大学第六医院的岳伟华教授课题组与语音人工智能科技公司「宇音数康」进行合作,开启了利用语音进行抑郁症筛查评估的合作研究项目。在经历了研究设计、伦理审查、数据收集、技术研发等阶段后,目前该项目已经进入了相关临床研究。

今年11月该项目组在《Frontiers in Psychiatry》发表了一篇临床研究论文,其基于纯语音信号处理的深度学习模型,可通过基于智能手机约30秒的语音进行抑郁症评估,且达到了82.14%的灵敏度和80.65%的特异性。即使在研究中采用了更高的对标标准(采用与精神科医师的DSM-5诊断结果对比,而欧美研究普遍采用与自测量表结果对比),该模型在临床研究中的性能仍超过了目前欧美相关企业的数值表现。

技术合作方「宇音数康」是一家语音人工智能科技公司,致力于通过自研的语音生物标记识别技术与AI平台,为精神心理健康领域提供智能、专业、可规模化的筛查、监测及干预解决方案。

“语音AI科技能够帮助人类进行高精度的、非侵入性的心理疾病检测。”该项目的语音模型在43000条临床音频会话组成的数据集上进行深度学习训练而得,并在独立验证集上进行测试与临床研究。所有患者会话均采集自精神科医生按照 DSM-5 国际标准进行诊断的患者,通过不同智能手机在不同环境中收集并录音。

“这有可能是目前世界上相关领域内最高质量的数据集。”

从技术迭代来看,该项目为利用深度学习技术快速识别和诊断抑郁症提供了一种新方法,并证明了从原始语音信号中提取的声音生物标志物对于抑郁症的早期评估与筛查具有很高的潜力。

在不久的未来,对于受到抑郁症等心理问题困扰的人而言,只需要完成30秒左右的语音任务,就可以在私密的环境中获得客观、专业、便捷的精神心理评估与筛查结果。

 

内容中包含的图片若涉及版权问题,请及时与我们联系删除