2022年北京冬奥会即将开启,这不仅是一场全世界奥运健儿与嘉宾欢聚的盛会,也将是一场科技赋能的“智慧”盛会。
人工智能技术发展和应用日新月异,正成为推动人类进入智能时代的决定性力量。超大规模智能模型作为推动AI科研从特定场景的单一模型向多场景共用模型范式变革的关键技术,2021年持续成为国际AI前沿研究和应用的热点。同时,随着新时代消费者对虚拟化内容与服务的需求不断增长,以及元宇宙概念的全球兴起,虚拟现实和人工智能技术也已成为全球关注的焦点。
根据全国第二次残疾人抽样调查数据,中国有超过 2700 万名残疾性听力障碍人士。本次冬奥会是中国历史上首次举办冬奥会,听障人群也期待着深入了解比赛资讯,全面感受这场精彩卓越的奥运盛会。
近期,有一项基于这两个新技术的新服务即将亮相北京冬奥会,那就是采用我国首个超大规模智能信息模型和虚拟数字人技术,为听障人士打造的“冬奥手语播报数字人”。

据了解,本次亮相北京卫视的“冬奥手语播报数字人”由北京市科委科技冬奥专班委托,智谱AI、凌云光和北京广播电视台联合打造,还得到了北京市残疾人联合会和市残联聋人协会的大力支持。系统以超大规模预训练模型为核心技术,自主搭建多模态肢体动作、表情、手指同步采集系统,运用跨模态拟人生成算法、超高精度写实数字人等行业领先技术,实现冬奥期间赛事新闻的实时专业手语翻译播报。
构建国内最大规模多模态手语语料库
据悉,《国家通用手语常用词表》和《国家通用盲文方案》于2018年作为语言文字规范正式发布。为了推广和普及国家通用手语,“冬奥手语播报数字人”系统完成了《国家通用手语词典》收录的8214条通用手语的采集和录制,并且语法都以听障群体习惯打法为准,以确保手语播报成果的准确性和专业度,更好地服务听障人群。
由于当前国内缺少较完善的手语语料数据,研发人员在北京市残疾人联合会和市残联聋人协会的支持下,邀请超过40余位聋人老师及手语专家进行手语文本转写和技术指导,并进行大范围听障群体评测,最终构建了符合国家通用手语规范的国内最大规模多模态手语语料库,词汇及语句总规模超10万。
打造手语播报“智能数字脑”
为构建能够理解、翻译语音和手语的智能数字大脑,“冬奥手语播报数字人”系统以超大规模预训练模型为核心技术,通过语义蒸馏及手语翻译快编模型,实现新闻播报语音实时蒸馏成语义高度接近的手语文字,并翻译成符合手语习惯的语序。最终,手语数字脑可以通过计算机模仿听障人士的大脑,进行实时手语播报驱动。
内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢