在近期一个名为《Learning to See the Physics World》的学术报告中,斯坦福大学计算机科学系助理教授吴佳俊对自己在学习理解物理世界方面的工作进行了概述(我们也可以将这类工作称为「物理场景理解」)。
“在AI研究中,我们会希望构建一种用于场景理解的人工智能系统。通过这种系统,我们不仅可以通过传统的计算机视觉方法识别出物体(例如,将图片分类为猫或狗)。我们还可以理解如下图所示的具有几何和物理性质的物体。
此外,如果智能体可以和场景进行交互,我们是否就能够更好地预测这些物体在未来的动态呢?对于生活在物理世界中的人类来说,我们可以毫不费力地与世界进行交互,我们也希望创造出具有相同能力的机器。”
吴佳俊本科毕业于清华姚班,之后在MIT相继获得硕士和博士学位,现在是斯坦福大学计算机科学系的助理教授,并且隶属于斯坦福视觉与学习实验室(SVL)和斯坦福AI实验室(SAIL)。他的博士生导师是麻省理工学院的Josh Tenenbaum教授和Bill Freeman教授。Josh Tenenbaum以对计算心理学和贝叶斯认知科学的贡献而闻名,而Bill Freeman的主要研究方向是计算机视觉、图形学和计算摄影学。吴佳俊的研究兴趣包括机器感知、推理及其与物理世界的相互作用,认为AI研究应该从人类认知中汲取灵感。
本文对报告进行了不改变原意的整理,感兴趣的可以戳原文。
内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢