报告摘要:当前,声纹识别领域仍然缺乏一套系统的、高效的、易扩展的开源训练工具。Kaldi虽然是语音领域主流的研究工具,但它对神经网络的支持有限,底层开发困难,不易工作的快速开展。为了满足日常研究需要,并能够在同样的条件下公平对比各种算法,厦门大学语音实验室基于Pytorch自行设计并开发了一套声纹识别开源工具ASV-Subtools,用来替代Kaldi的神经网络训练。通过衔接Kaldi的数据处理和Pytorch的网络训练,ASV-Subtools极大地提高了研究效率。报告将具体介绍ASV-Subtools的工程结构、训练框架和相关算法的改进,同时将展示基于Voxceleb等数据库的实验结果。
讲者介绍:洪青阳,厦门大学副教授,天聪智能创始人,全国人机语音通讯会议(NCMMSC)常设委员,公安部安防行业标准(SAC/TC100/SC2)委员。研究方向包括语音识别、声纹识别和语音合成。先后主持国家自然基金2项,科技部创新基金2项,省杰出青年基金1项。2013年,当选为公安部TC100/SC2标准委员,代表着安防声纹标准的最高水平。2014年底,主持研发的大规模声纹检索系统分析语音超过10万小时。2015年,其主持研发的社区矫正声纹识别系统应用到福建、江苏、广东、辽宁、广西等十三个省市。2018年3月起,研发的声纹识别技术先后在华为P20、Mate20等手机落地应用。2018年11月,带领厦门大学xmuspeech团队在第三届“东方语言语种识别竞赛”获得第一名。2019年1月,成功研发福建省第一套闽南话语音识别系统、国内第一套闽南话语音合成系统。2019年起,其研发的语音识别技术应用到电力调度、证券客服等系统。2020年6月,出版专著《语音识别:原理与应用》。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢