- 简介传统上,生物声学依靠频谱图和连续的逐帧音频表示来分析动物声音,并作为机器学习模型的输入。同时,国际音标(IPA)系统提供了一种可解释的、语言无关的方法来转录人类语音声音。本文介绍了ISPA(跨物种音标),这是一个精确、简洁、可解释的系统,旨在将动物声音转录为文本。我们比较了基于声学和特征的方法来转录和分类动物声音,并展示了它们与基线方法(利用连续、密集的音频表示)具有可比性的性能。通过用文本表示动物声音,我们有效地将它们视为“外语”,并展示了已建立的人类语言机器学习范例和模型,例如语言模型,可以成功应用于提高性能。
- 图表
- 解决问题本论文旨在介绍一种精确、简洁且可解释的系统ISPA(Inter-Species Phonetic Alphabet),用于将动物声音转录为文本,并比较基于声学和基于特征的方法进行转录和分类动物声音的表现,以证明ISPA系统的有效性。
- 关键思路ISPA系统是一种将动物声音转录为文本的系统,通过将动物声音表示为文本,将其视为一种“外语”,并展示了将已建立的人类语言机器学习范例和模型应用于动物声音分类的有效性。
- 其它亮点论文比较了基于声学和基于特征的方法进行动物声音转录和分类的表现,并证明了ISPA系统的有效性。实验使用了多个数据集,并且提供了开源代码。此外,通过将动物声音表示为文本,可以将已建立的人类语言机器学习范例和模型应用于动物声音分类。
- 最近的相关研究包括使用深度学习模型进行动物声音分类的研究,如“Deep neural networks for acoustic modeling of wildlife species”,以及使用人工神经网络进行动物声音分类的研究,如“Artificial neural networks for bird song recognition”。
沙发等你来抢
去评论
评论
沙发等你来抢