Sparse Binarization for Fast Keyword Spotting

2024年06月09日
  • 简介
    随着语音激活设备和应用的普及,关键词识别(KWS)模型使用户能够在各种场景下无需使用手进行技术交互,提高了便利性和可访问性。在智能手机和嵌入式系统等边缘设备上部署KWS模型,可以为实时应用、隐私和带宽效率带来显著的好处。然而,这些设备往往具有有限的计算能力和存储器,这就需要对神经网络模型进行优化,以提高效率而不会显着影响其准确性。为了解决这些挑战,我们提出了一种基于稀疏输入表示和线性分类器的新型关键词识别模型。该模型比先前最先进的边缘设备兼容模型快4倍,准确性更高。我们证明了我们的方法在嘈杂环境下更加稳健,同时速度更快。我们的代码可在https://github.com/jsvir/sparknet上获得。
  • 作者讲解
  • 图表
  • 解决问题
    论文旨在解决在边缘设备上实现关键词检测模型的高效性和准确性问题。
  • 关键思路
    论文提出了一种基于稀疏输入表示和线性分类器的关键词检测模型,比之前的最先进的边缘设备兼容模型快四倍,而且准确率更高。
  • 其它亮点
    实验表明,该模型在嘈杂的环境下更加稳健,同时具有快速的特点。作者提供了开源代码,可在GitHub上获取。值得进一步研究的工作包括如何在更广泛的语音识别任务中使用该模型。
  • 相关研究
    与本论文相关的研究包括使用深度学习的语音识别和关键词检测模型,以及在边缘设备上实现高效的神经网络模型等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问