- 简介健康声学信号,如咳嗽和呼吸声,已知包含有用的健康信号,具有监测健康和疾病的显著潜力,但在医疗机器学习社区中尚未得到充分探索。现有的健康声学深度学习系统通常只针对单一任务进行狭窄训练和评估,这受数据限制并可能阻碍推广到其他任务。为了弥补这些差距,我们开发了HeAR,这是一个可扩展的自监督学习深度学习系统,使用313亿个两秒长的音频剪辑的遮蔽自编码器进行训练。通过线性探测,我们将HeAR建立为33个健康声学任务在6个数据集上的最先进的健康音频嵌入模型。通过引入这项工作,我们希望能够促进并加速进一步的健康声学研究。
-
- 图表
- 解决问题本文旨在开发一种可扩展的自监督学习深度学习系统,使用掩码自编码器在一个拥有3.13亿个2秒长音频剪辑的大型数据集上进行训练,以解决健康声学数据在医疗机器学习社区中的局限性和瓶颈问题。
- 关键思路本文提出的HeAR是一种基于自监督学习的深度学习系统,通过线性探针在6个数据集上的33个健康声学任务中,将其建立为最先进的健康音频嵌入模型。
- 其它亮点本文的亮点是使用大型数据集进行自监督学习,提出了一种可扩展的深度学习系统,以解决健康声学数据的局限性和瓶颈问题。通过线性探针,本文在多个数据集上展示了HeAR的性能优越性。本文的代码和数据集已公开。
- 最近的相关研究包括:1)使用卷积神经网络进行呼吸音分析的研究;2)使用深度学习方法进行咳嗽声检测的研究;3)使用自编码器进行心脏音信号分类的研究。
- 1
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流