超越个体智能！西安交大发布多Agent综述：协同、失败归因和自进化

目前，大多基于大语言模型（LLM）的自主 Agent，已经能完成单步推理、任务规划和工具调用。但当任务需要跨角色、跨工具、跨环境持续协调时，单个 Agent 很容易在长时间交互中失去连贯性，难以稳定协调多步行动。

多 Agent 系统（Multi-Agent System，MAS），则试图通过分工协作解决这一问题：不同 Agent 分别负责规划、执行、验证、检索和工具调用。但只要某个环节出错，错误就可能在后续协作中传播，导致系统级失败。即使现有多 Agent 系统知道哪里存在错误，也很难自动调整结构，避免下次再犯同样的错误。

过往研究通常分别讨论单 Agent 能力、多 Agent 协作或 Agent 自进化，但很少把这些主题放在同一个运行生命周期中考察。

在这篇综述中，西安交通大学 MOE KLINNS Lab 团队及其合作者提出了 LIFE progression 框架，将基于 LLM 的多 Agent 系统组织为“个体能力”、“协作整合”、“失败归因”和“自进化”四个相互依赖的阶段。

图｜基于 LLM 的多 Agent 系统运行生命周期

针对每个阶段，他们提供了系统性分类，并形式化刻画了相邻阶段间的依赖关系，揭示了每个阶段如何依赖并约束下一阶段。

图｜按运行生命周期组织的多 Agent 系统概览，右侧总结了各阶段的代表性主题与系统，左侧轴线则展示了从行动到进化的跨阶段推进过程

除梳理现有工作外，他们还识别了各阶段的开放挑战，并提出了面向闭环多 Agent 系统的跨阶段研究议程。该类系统能够持续诊断故障、重组结构、优化 Agent 行为，将当前协调框架向更具自组织性的集体智能形式延伸。

该综述旨在为自主、自我改进的多 Agent 智能提供系统性参考与概念路线图。

论文链接：https://arxiv.org/abs/2605.14892

GitHub地址：https://github.com/mira-ai-lab/awesome-mas-life

多Agent系统协作

研究团队指出，基于 LLM 的 Agent 通常是在基础模型外接记忆、规划和工具模块，让 Agent 进入“观察-推理-行动-反馈”的闭环。

其中，推理负责在当前观察和上下文下做判断。记忆解决 Agent 如何利用既往交互经验。规划负责把高层目标拆解为可执行步骤，并根据环境反馈调整行动路径。工具使用负责把 Agent 的动作空间扩展到文本生成之外，使其可以调用外部函数、API、代码解释器和网页服务。

图｜沿推理流水线组织的个体 Agent 能力架构

不过，单个 Agent 的问题也很明显。研究团队指出，当前评估仍缺少跨能力分析，例如记忆改进如何影响规划，规划错误如何影响工具调用；token 消耗、延迟和成本等效率指标也很少被纳入 benchmark 设计。

图｜按评估领域组织的单 Agent 能力基准测试

与单个 Agent 不同，多 Agent 系统中任意一对 Agent 都可直接通信并协作。研究团队将多 Agent 系统协作拆解为：角色、通信、编排和交互。

图｜多 Agent 协作系统概览

角色决定哪些 Agent 参与任务，以及它们分别负责规划、执行、验证、评估还是工具调用。角色可以是静态指定的，也可以根据任务状态动态生成、选择或调整。静态角色更容易解释和控制，动态角色则更适合开放任务和非稳定环境。

通信决定 Agent 之间如何交换任务信息、中间结果和反馈。它既包括自然语言消息、结构化文档、消息压缩和投票机制，也包括更标准化的协议。研究团队将通信协议分为内部协议和外部协议：A2A、ANP 更偏向 Agent 之间的互操作，MCP 则主要规范 Agent 如何连接外部工具、数据源和服务。

图｜ Agent 通信协议比较

编排决定 Agent 如何连接、任务如何路由。集中式编排便于全局控制，但容易形成瓶颈；分布式编排更灵活，也更能避免单点故障，但共识形成和冲突解决更难；混合式编排则试图在控制与自主之间取得平衡。

交互描述 Agent 在执行过程中如何协作。顺序交互适合阶段依赖明确的任务，例如先规划、再执行、再审查，但早期错误容易沿流程传播。并行交互可以提升搜索多样性，让多个 Agent 同时探索候选方案，但也需要额外处理冲突、聚合和一致性问题。

在协作评估上，近期 benchmark 正从静态任务表现转向动态协作质量。LLM-Coordination 分析多个 LLM 如何共享信息并完成共同目标；LLMArena 考察信息不完全动态环境中的适应性和序贯决策，BattleAgentBench 同时覆盖合作与竞争；MultiAgentBench 则用里程碑 KPI 评估编排质量，并研究通信拓扑对协作效率的影响。

图｜多 Agent 协作评测基准。该图从任务组成、评测样本和评测指标三个方面比较了现有基准

多Agent系统失败归因

研究团队也指出，虽然多 Agent 系统可以通过专门化 Agent 之间的协作提升复杂任务求解能力，但其高度耦合的协作过程也会放大系统脆弱性，使错误更容易在任务分解、Agent 间通信和协调决策中出现。这些局部错误进入协作链条后，会被后续 Agent 继续使用、传播和放大，最终表现为系统级失败。

图｜多 Agent 系统中的失败归因机制

研究团队认为，当前多 Agent 系统失败归因主要沿三条路线展开：数据驱动方法从失败轨迹中学习异常模式，把人工查日志转化为模型化诊断；约束引导方法通过范围界定、错误分类、责任划分和结果验证等步骤，降低长轨迹归因难度；因果推断方法则借助反事实重放和干预分析，识别真正导致失败的行为、交互依赖或状态转移。

在评估层面，相关研究也从小规模人工标注，转向更系统的数据集构建和评估协议。标注对象从责任 Agent 和关键步骤，扩展到错误类型、交互边、功能模块和工作流根因；指标也从定位准确率，扩展到解释质量、过程忠实性和归因可信度。评估重点正从“找到出错位置”，转向刻画失败的发生、传播和因果责任。

图｜多 Agent 系统中异常归因评估的场景示意图。该图展示了三类输入案例：单点故障、传播链故障和多原因故障，并给出了相应的多粒度归因目标与评估标准

同时，研究团队指出，现有多 Agent 系统失败归因方法仍有明显局限，例如归因定义尚未统一，异常传播具有强耦合和延迟暴露特征，细粒度归因在长程、多角色轨迹中仍不稳定，自动生成数据与真实失败之间存在分布差异，归因结果也尚未充分连接到验证、干预和修复。

因此，未来多 Agent 系统失败归因需要从单点定位走向更完整的诊断框架，包括统一分类标准、高真实性数据集、结构化传播建模、因果推断，以及面向修复的闭环评估。

图｜多 Agent 失败归因方法比较

多Agent系统自进化

研究团队认为，归因和自进化应当构成一个持续学习闭环：归因定位失败根因，缩小进化搜索空间；自进化再根据诊断结果调整提示、记忆、通信、拓扑、团队组成和系统级设计。

在形式化上，他们把自进化多 Agent 系统看作一个按生成更新的离散过程。每一代系统都包括 Agent 集合、环境、通信协议、编排拓扑和协作策略。系统根据历史上下文生成下一代配置，这里的历史上下文包括执行轨迹、评估反馈、错误归因和同伴批判。

研究团队将多 Agent 系统自进化分为以下层级：

图｜多 Agent 自进化框架概览。上图详细展示了由变异、选择和保留驱动的连续自进化循环，并将环境奖励、同伴 Agent 评议和自我评估纳入选择压力；下图将进化目标划分为三个层级：Agent 层级、系统层级和元层级

Agentic Evolution 修改个体 Agent 内部组件，包括提示、记忆和模型参数。提示进化成本低、可解释，适合快速调整角色和操作策略；记忆进化支持跨任务经验积累，让系统保存协作中的成功和失败模式；参数进化训练成本更高，但可以把能力内化进模型权重，减少推理时额外开销。

图｜Agentic 自进化方法的分类与多维比较

Systemic Evolution 关注 Agent 如何共同工作，包括通信拓扑、团队组成和共享记忆。它决定信息如何流动、哪些 Agent 应被创建或移除，以及群体经验如何跨 episode 保留。相比只修改单个 Agent，系统级进化更直接影响多 Agent 系统的协作效率和鲁棒性。

图｜Systemic Evolution 自进化方法比较

Meta Evolution 则把完整多 Agent 系统设计视为候选系统，在更大的设计空间中搜索、评估和复用。它不只是调整某次任务中的局部结构，而是积累可迁移的系统设计经验。例如，系统可以把历史上表现良好的架构存入 archive，在新任务中复用或重组。

在驱动机制上，研究团队使用 Variation-Selection-Retention（VSR）框架分析现有方法：系统如何产生变异，如何选择更好的候选，如何保留进化收益。常见机制包括 LLM Reflection、强化学习、进化算法、Textual Gradient、启发式更新和监督微调。这几个方法各有优势，反思机制进入门槛低，适合用自然语言反馈快速调整提示和策略；强化学习适合参数和拓扑优化；进化算法能保留多样性；Textual Gradient 可以把自然语言诊断转化为结构修改；启发式更新计算高效，但探索能力有限；监督微调更像把已验证行为模式迁移进模型。

不过，研究团队也指出，真正混合多种机制的工作仍然很少。现有方法往往只在某个局部层面优化，例如只改提示、只调拓扑或只做离线搜索。未来更有潜力的方向，是把失败归因、结构搜索、记忆更新和参数巩固连接成同一个闭环。

不足和未来方向

研究团队指出，自进化多 Agent 系统仍处在早期阶段，距离真正稳定可用的闭环系统还有不少问题，当前主要挑战和未来方向包括：

1.从短期适应走向持久终身进化

当前许多系统级和元级自进化框架，要么为特定任务临时生成拓扑或角色，任务结束后就丢弃；要么在部署前离线搜索架构，再固定使用。

未来的多 Agent 系统需要在不重置组织记忆的情况下，跨多个任务持续积累协作经验。但这也会带来灾难性遗忘、记忆检索效率下降和长期上下文成本上升等问题。

2.平衡可扩展性与进化成本

自进化会引入很高的计算开销。多 Agent 系统的配置空间非常大，包括 Agent 数量、提示设计、通信拓扑和协作策略。每评估一个候选架构，往往都要完整运行一次多 Agent 工作流，消耗大量推理时间和 token 成本。

未来，研究人员可能需要把轻量架构生成器和更严格的离线结构化搜索结合起来。

3.安全与对齐会变得更复杂

当多 Agent 系统能够改写自身提示、调整通信协议，甚至生成新的同伴 Agent 时，它也可能绕过原本由人类设计的安全护栏。如果进化目标过度强调任务成功，系统可能出现 Reward hacking，甚至进化出欺骗性通信或规避限制的策略。因此，对齐不能只停留在单个模型层面，而要成为进化过程本身的约束。

4.从静态测试走向开放式长期评估

目前大部分多 Agent 系统仍依赖 MMLU、GSM8K 等静态 benchmark，但这些测试只能衡量某一代系统的任务表现，无法评估系统是否能随环境变化持续调整结构。

研究团队认为，未来评估应关注系统进入新任务或新领域后，能以多快、多稳定的方式找到可行架构，并在长期交互中保持适应性和安全性。

内容中包含的图片若涉及版权问题，请及时与我们联系删除

超越个体智能！西安交大发布多Agent综述：协同、失败归因和自进化

多Agent系统协作

多Agent系统失败归因

多Agent系统自进化

不足和未来方向

评论列表

评论