报告摘要:由声音辨认说话者的身份或者所使用的语言种类,关键点是寻找本质的说话人特征或者语种特征。说话人特征不仅受说话人本身声道结构影响,一定程度上依赖于文本作为信息传达的载体,不论是文本相关还是文本无关说话人识别任务中,引入文本信息(如音素)辅助训练说话人特征提取网络,可以改善识别性能。同样地,引入音素识别任务用于训练提取语种特征,也有助于提升语种识别性能。报告重点分析在声纹/语种特征提取流程(包括帧级别和段级别)中音素信息所起到的作用效果。特别地,针对语种识别任务中,对比分析不同语种音素识别模型的选择对多任务系统性能的影响。
讲者介绍:李琳,副教授、硕导 。2008 年获中国科学技术大学电路与系统专业博士学位,同年被引进到厦门大学工作,主要研究方向为说话人识别、智能语音处理等。主持国家自然科学基金项目1项,科技部重点研发计划子课题1项,作为第一合作者参与国家自然科学基金项目2项。是国际IEEE学会会员,NCMMSC常设机构委员会委员,CCF语音对话与听觉专业工作组委员。在国内外学术刊物或核心会议上发表学术论文累计50多篇,近20篇被SCI、EI等科技索引摘入,发明专利授权2项,公开3项。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢