GitHub上有一个项目最近登上了每日趋势榜,只需5秒,就能用AI 技术来模拟声音来生成任意语音内容,并且还支持中文。目前该项目在GitHub已狂揽8700星。
MockingBird的主要特性包括:
1、支持普通话并使用多种中文数据集进行测试:aidatatang_200zh,magicdata,aishell3,biaobei,MozillaCommonVoice等;
2、适用于pytorch,已在1.9.0版本(最新于2021年8月)中测试,GPU Tesla T4和GTX 2060;
3、可在Windows操作系统和linux操作系统中运行(苹果系统M1版也有社区成功运行案例);
4、仅需下载或新训练合成器(synthesizer)就有良好效果,复用预训练的编码器/声码器,或实时的HiFi-GAN作为vocoder;
5、提供一个Webserver可查看训练结果,供远程调用。
项目的作者是前Facebook的工程师,目前创业状态,创作的Mocking Bird仅用10天就窜上了GitHub Trending榜。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢