Is Sora a World Simulator? A Comprehensive Survey on General World Models and Beyond

2024年05月06日
  • 简介
    普遍的世界模型是实现人工通用智能(AGI)的关键途径,是各种应用的基石,包括虚拟环境和决策系统。最近,Sora模型的出现引起了极大的关注,因为它展示了对物理定律的初步理解,具有显著的模拟能力。在这项调查中,我们全面探索了世界模型的最新进展。我们的分析贯穿于视频生成的生成方法的前沿,其中世界模型是关键构造,有助于合成高度逼真的视觉内容。此外,我们还详细研究了自主驾驶世界模型这一新兴领域,勾勒出它们在重塑交通和城市流动性方面不可或缺的作用。此外,我们深入探讨了在自主代理中部署的世界模型固有的复杂性,阐明了它们在实现动态环境下智能交互方面的重要意义。最后,我们还研究了世界模型的挑战和限制,并讨论了它们的潜在未来方向。我们希望这项调查可以为研究社区提供基础参考,并激发持续的创新。此调查将定期更新,网址为:https://github.com/GigaAI-research/General-World-Models-Survey。
  • 图表
  • 解决问题
    综述了世界模型在人工智能中的应用和发展,探讨了世界模型的挑战和未来方向。
  • 关键思路
    世界模型是实现人工智能通用性的关键,本文重点探讨了世界模型在视频生成、自动驾驶和智能代理等领域的应用。
  • 其它亮点
    本文详细介绍了世界模型在视频生成、自动驾驶和智能代理等领域的应用,包括模型结构、实验设计和数据集等。同时,本文还探讨了世界模型面临的挑战和未来发展方向。
  • 相关研究
    相关论文包括:The Sora Model: A General World Model for AGI,Generative Models for Video Prediction and Compression,End-to-End Learning of Driving Models from Large-Scale Video Datasets,Learning to Navigate in Complex Environments,等等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论