来自交大 x-lance 跨媒体语言智能实验室的 F5-TTS!\x0a\x0aF5-TTS\x26nbsp;是一款支持多语言切换、速度控制和情感表达的高级 TTS(文本转语音) 系统。\x0a\x0a· 经过 10 万小时的数据训练\x0a· 零样本语音克隆\x0a· 速度控制(基于总持续时间)\x0a· 基于情感的合成\x0a· 合成双人 podcast\x0a· DiT with ConvNeXt V2\x0a· Flow Matching\x0a\x0a快来 Star ⭐⭐⭐!\x0a\x0a[1] 论文地址👇\x0ahttps://arxiv.org/abs/2410.06885\x0a[2] 开源地址👇\x0ahttps://github.com/SWivid/F5-TTS
评论
沙发等你来抢