DB3V: A Dialect Dominated Dataset of Bird Vocalisation for Cross-corpus Bird Species Recognition

2024年06月11日
  • 简介
    在鸟类学中,众所周知不同地区的鸟类物种会在其鸣叫中表现出不同的方言。因此,仅通过鸟类的叫声来识别鸟类物种的计算方法面临着重大的挑战。越来越多的人对了解物种特定方言对鸟类物种识别方法的有效性影响感兴趣。尽管通过扩大方言数据集可能会缓解这种影响,但目前缺乏公开可用的测试数据,这阻碍了稳健的基准测试工作。本文介绍了鸟类声音方言主导数据集,这是第一个专注于鸟类声音方言的跨语料库数据集。DB3V包括来自美国连续48个州的三个不同地区的10种鸟类物种的超过25小时的音频记录。除了介绍数据集外,我们还进行了分析并建立了跨语料库鸟类识别的基准模型。数据和代码可在网上公开获取:https://zenodo.org/records/11544734。
  • 图表
  • 解决问题
    该论文旨在解决通过声音识别鸟类物种时方言差异带来的挑战,缺乏公开测试数据集的问题。
  • 关键思路
    该论文提出了一个跨语料库的鸟类方言数据集,用于研究方言对鸟类识别方法的影响,并建立了基准模型。
  • 其它亮点
    该数据集包含来自三个不同地区的10种鸟类超过25小时的音频记录,并且提供了公开的数据和代码。该论文的贡献在于提供了一个新的数据集和基准模型,以便更好地研究方言对鸟类识别的影响。
  • 相关研究
    在这个领域中,最近的相关研究包括《Bird Audio Detection Challenge》和《BirdCLEF》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论