QQ 浏览器「听书」背后的 StyleTTS 让合成语音有了情感的温度。
今年 4 月,QQ 浏览器宣布 「小说频道」正式变更为 「免费小说」频道,这意味着阅文平台旗下的万千小说将免费供用户阅读。网络文学已浮浮沉沉二十余载,其阅读方式也随之几经改变。
与此同时,科技的发展也在革新着阅读方式,例如语音合成技术的成熟让越来越多的读者选择听小说。语音合成技术中,让声音富有情感和表现力,一直是一大难点。而 QQ 浏览器最近上线的「听书」功能中,应用腾讯 PCG AI 交互部 StyleTTS 端到端合成框架业内创新技术让合成语音有了情感的温度,高保真音色可与真人媲美。
QQ 浏览器使用的 StyleTTS 利用精心设计的语音语料库进行声学模型和文本处理模型的训练,得到的模型深度挖掘了语音语言特性,合成的语音清晰、自然、亲切、具有高表现力。现阶段 QQ 浏览器「听书」功能已上线多种音色,每个音色都有自己的风格,满足不同人群的阅读喜好。在最新的一次更新中,QQ 浏览器上线了三名作家 AI 音色包,不同寻常的玩法背后是 QQ 浏览器为 AI 合成声音进一步应用落地的尝试。
图 StyleTTS框架图

内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢