由智源社区举办的「智源LIVE 第11期 | 胡迪:听声识物与辨物知声」将于1月19日(周三)19:00-20:00举办,中国人民大学助理教授胡迪作主旨报告。

报告简介:视、听是大脑接收外界信息的主要方式,它们通过相互协作,帮助我们在环境感知、理解、决策等任务上具备更加精准或高效的表现。反观当前机器智能的发展,我们已分别在计算机视觉、声音信号处理等领域取得了长足进步,但在多种模态信息的协同感知上仍处于研究的早期阶段。本次报告将聚焦典型的视音多模态场景,针对视音数据,介绍它们在环境感知、场景分析与跨模态理解等方面的协同学习机制和相关应用。

考虑到讲者报告时间有限,欢迎智源社区用户在本贴评论区留言,官方会邀请嘉宾和讲者回复,详情如下:

  • 格式:xx好,我想请问xxx问题;

内容中包含的图片若涉及版权问题,请及时与我们联系删除