A Survey of Self-Evolving Agents: On Path to Artificial Super Intelligence

2025年07月28日
  • 简介
    大型语言模型(LLMs)虽然展现了强大的能力,但本质上仍是静态的,无法根据新任务、不断发展的知识领域或动态的交互环境调整其内部参数。随着LLMs越来越多地应用于开放性、交互性更强的环境,这种静态特性已成为一个关键瓶颈,迫切需要能够实时自适应推理、行动并持续演化的智能体(agent)。这一范式转变——从扩展静态模型转向开发自我演化的智能体——引发了人们对支持从数据、交互和经验中持续学习与适应的架构与方法的日益浓厚的兴趣。 本综述首次对自我演化的智能体进行了系统而全面的回顾,围绕三个基础维度展开:演化的对象(what)、演化的时机(when)以及演化的手段(how)。我们探讨了智能体各个组成部分(如模型、记忆、工具、架构)中的演化机制,将适应方法按阶段分类(例如,测试中阶段与测试间阶段),并分析了指导演化式适应的算法与架构设计(例如,标量奖励、文本反馈、单智能体系统与多智能体系统)。此外,我们还分析了专为自我演化智能体设计的评估指标和基准测试,强调了其在编程、教育和医疗等领域的应用,并指出了在安全性、可扩展性和共演化动态等方面的关键挑战与研究方向。 通过提供一个结构化的框架来理解和设计自我演化的智能体,本综述为在研究与实际应用中推动自适应智能系统的发展奠定了基础,最终为实现人工超级智能(ASI)指明了方向——在这一阶段,智能体能够自主演化,在多种任务中表现出等于或超越人类水平的智能表现。
  • 图表
  • 解决问题
    论文试图解决大语言模型(LLMs)静态不变的本质问题,即LLMs无法根据新任务、知识领域或动态交互环境实时调整其内部参数。随着LLMs在开放、交互式场景中的广泛应用,这种静态性已成为关键瓶颈。论文试图验证是否可以通过构建“自我演化的智能体”来实现模型的实时自适应和进化。
  • 关键思路
    论文提出了一种系统性的自我演化智能体框架,围绕三个核心维度展开:进化什么(what)、何时进化(when)、如何进化(how)。相比传统研究聚焦于模型扩展和静态优化,这篇论文强调了从静态模型向具备持续学习与适应能力的动态智能体范式的转变,并系统梳理了演化机制、方法和评估体系。
  • 其它亮点
    1. 首次对自我演化智能体进行全面系统的综述,涵盖模型、记忆、工具、架构等组件的演化机制。 2. 分类整理了不同阶段的适应方法,如测试时内部调整(intra-test-time)和测试间调整(inter-test-time)。 3. 分析了引导演化的算法和架构设计,如标量奖励、文本反馈、单智能体与多智能体系统。 4. 总结了适用于自我演化智能体的评估指标和基准测试,并展示了在编程、教育、医疗等领域的应用。 5. 指出未来研究的关键挑战,包括安全性、可扩展性和协同演化动力学等方向。
  • 相关研究
    1. Towards Continual Learning for Large Language Models (2023) 2. Test-Time Training and Prompt Tuning for Dynamic Adaptation of Language Models (2023) 3. Evolving Neural Architectures via Reinforcement Learning (2022) 4. Interactive Learning with Human-in-the-Loop for Adaptive Agents (2023) 5. Self-Improving Systems: A Survey of Autonomous Learning in AI (2021)
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论