人类天生就能够推理周围不同物体的行为。这些物理推理技巧对于解决日常问题非常有价值,因为它们可以帮助我们选择更有效的行动来实现特定目标。
计算机科学家一直试图在人工智能(AI)智能体中复制这些推理能力,以提高它们在特定任务上的表现。然而,到目前为止,还缺乏一种可靠的方法来训练和评估 AI 算法的物理推理能力。
近日,来自澳大利亚国立大学的研究人员提出了一种新的测试平台 Phy-Q,旨在填补这一文献空白。Phy-Q 要求智能体对物理场景进行推理并采取适当的行动。
论文一作 Cheng Xue 说:「从这项研究中,我们看到人工智能系统的物理推理能力远远低于人类的能力水平,此外,我们的评估表明,具有良好局部泛化能力的智能体很难学习潜在的物理推理规则,无法进行广泛的泛化。」
该研究以「Phy-Q as a measure for physical reasoning intelligence」为题,发布在《自然机器智能》(Nature Machine Intelligence)上。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢