- 简介当比较不同语言的语音时,学者们通常使用单个音素的特征表示来确定细粒度的音素相似性。尽管已经提出了大量语音音素的二进制特征系统,但大规模的计算应用程序通常面临挑战,即所提出的特征系统-即使它们列出了几千个音素的特征-仅覆盖了实际跨语言数据中反映的众多语音音素的一小部分。为了解决已知语音音素缺失数据的问题,我们提出了一种新方法,可以为可以在跨语言转录系统(CLTS)参考目录提供的国际音标标准化版本中表示的所有音素动态创建二进制特征向量。由于CLTS在涵盖超过2,000种不同语言变体的大型数据集中得到积极应用,因此我们生成二进制特征向量的过程为访问非常大的多语种词汇表提供了即时访问。在不同数据集上以不同方式测试我们的特征系统证明,该系统不仅有助于提供比较语音音素相似性的简单方法,而且还展示了其在未来跨语言机器学习应用中的潜力。
- 图表
- 解决问题论文试图解决如何在语音识别中比较不同语言的语音相似性的问题,尤其是对于那些没有被覆盖在二元特征系统中的语音。
- 关键思路论文提出了一种新的方法,可以动态地为所有可以在CLTS参考目录中表示的语音创建二元特征向量,从而提供了一个非常大的多语种词汇表的访问方式。
- 其它亮点论文的方法不仅可以提供比较语音相似性的简单方法,还可以用于未来的跨语言机器学习应用。实验设计合理,使用了大量的数据集,并且开源了代码。
- 近期的相关研究包括《A Binary Features Approach to Cross-Linguistic Typology》和《The World Phonotactics Database》等。
沙发等你来抢
去评论
评论
沙发等你来抢