论文链接:https://arxiv.org/pdf/2205.10839.pdf
视觉语音,即语音的视觉领域,因其在公共安全、医疗、军事防御、影视娱乐等领域的广泛应用而受到越来越多的关注。深度学习技术作为一种强大的人工智能策略,广泛地推动了视觉语音学习的发展。在过去的五年中,许多基于深度学习的方法被提出来解决这一领域的各种问题,特别是视觉语音的自动识别和生成为了进一步推动视觉语音的研究,本文对视觉语音分析中的深度学习方法进行了综述。我们涵盖了视觉语音的不同方面,包括基本问题、挑战、基准数据集、现有方法的分类和最先进的性能。此外,我们还指出了现有研究的不足,并对未来的研究方向进行了探讨。

内容中包含的图片若涉及版权问题,请及时与我们联系删除