Aligning Cyber Space with Physical World: A Comprehensive Survey on Embodied AI

简介

具有体现人工智能（Embodied AI）的能力对于实现人工通用智能（AGI）至关重要，并为连接网络空间和物理世界的各种应用提供了基础。最近，多模态大模型（MLMs）和世界模型（WMs）的出现引起了人们的广泛关注，由于它们具有出色的感知、交互和推理能力，因此成为体现智能代理的大脑的有前途的架构。然而，在MLMs时代，还没有全面的关于体现人工智能的调查。在本调查中，我们全面探讨了体现人工智能的最新进展。我们的分析首先导航了体现机器人和模拟器的代表作品的前沿，以充分了解研究重点及其局限性。然后，我们分析了四个主要的研究目标：1）体现感知，2）体现交互，3）体现代理和4）模拟到现实的适应，涵盖了最先进的方法、基本范例和全面的数据集。此外，我们探讨了虚拟和真实体现代理中MLMs的复杂性，突出了它们在促进动态数字和物理环境中的交互方面的重要性。最后，我们总结了体现人工智能的挑战和局限性，并讨论了它们的潜在未来方向。我们希望这项调查能为研究社区提供基础参考，并激发持续创新。相关项目可在https://github.com/HCPLab-SYSU/Embodied_AI_Paper_List找到。
作者讲解·1
- 讲解视频
- 相关报道(1)
图表
解决问题

综述最新的多模态大模型和世界模型在具有身体的人工智能中的应用和挑战。
关键思路

通过综述多模态大模型和世界模型在具有身体的人工智能中的最新应用和挑战，为研究社区提供基础参考和激励持续创新。
其它亮点

该综述分析了四个主要的研究目标：1）具有身体的感知，2）具有身体的交互，3）具有身体的代理，4）从模拟到现实的适应。此外，还探讨了虚拟和真实具有身体的代理中多模态大模型的复杂性，强调了它们在促进动态数字和物理环境中的交互中的重要性。
相关研究

最近的相关研究包括：1）《Multi-modal Large Models in Embodied AI》2）《World Models》3）《Embodied Intelligence》4）《Embodied AI》

Aligning Cyber Space with Physical World: A Comprehensive Survey on Embodied AI

提问交流

提问交流