本文介绍了一种新开发的同步神经语音转换系统及其评估。该系统包括三个全增量神经处理模块,分别用于自动语音识别(ASR)、机器翻译(MT)和文本-语音合成(TTS),以研究其在系统中的听说时差、语音延迟及模块级性能的总体延迟。

论文链接

内容中包含的图片若涉及版权问题,请及时与我们联系删除