- 简介近年来,视觉语言导航(VLN)受到越来越多的关注,许多方法已经出现以推进其发展。基础模型的显著成就已经塑造了VLN研究的挑战和提出的方法。在本调查中,我们提供了一个自上而下的回顾,采用了一个基于原则的行动规划和推理框架,并强调了当前方法和未来机会,利用基础模型来解决VLN挑战。我们希望我们的深入讨论可以提供有价值的资源和见解:一方面,里程碑式地记录进展并探索基础模型在该领域中的机会和潜在角色,另一方面,将VLN中的不同挑战和解决方案组织起来,以供基础模型研究人员参考。
- 图表
- 解决问题论文旨在回顾Vision-and-Language Navigation(VLN)领域的研究进展,探讨如何利用基础模型解决VLN中的挑战和问题。
- 关键思路论文采用了一种基于原则的框架来进行实体规划和推理,强调了利用基础模型来解决VLN挑战的当前方法和未来机会。
- 其它亮点论文提供了一个系统的框架来回顾和总结VLN领域的研究进展,讨论了基础模型在VLN中的应用和潜在机会。论文还介绍了一些数据集和开源代码,并提供了一些未来研究的方向。
- 在VLN领域,还有一些相关的研究,例如Learning to Navigate Unseen Environments: Back Translation with Environmental Dropout和Embodied Vision-and-Language Navigation in Continuous Environments等。
沙发等你来抢
去评论
评论
沙发等你来抢