- 简介大语言模型(LLM)智能体的快速发展,亟需构建稳健的记忆系统,以支撑连贯的长期交互与复杂的推理能力。得益于大语言模型强大的能力,当前研究重心已从简单的上下文扩展,转向专门面向智能体设计的记忆系统开发。然而,现有方法通常依赖于僵化的检索粒度、以累积为主的维护策略,以及粗粒度的更新机制。此类设计选择导致所存储的信息与任务特定的推理需求之间长期存在不匹配问题,同时致使逻辑矛盾随时间推移而不断累积且未加管控。为应对上述挑战,我们提出一种基于多智能体协同的自适应记忆框架(Adaptive Memory via Multi-Agent Collaboration, AMA)。该框架利用多个协同工作的智能体,在多种粒度层级上对记忆进行统一管理。AMA采用分层式记忆架构,能够根据任务复杂度动态调整检索粒度:其中,“构建者”(Constructor)与“检索者”(Retriever)协同工作,实现多粒度记忆的构建与查询请求的自适应路由;“判别者”(Judge)则负责验证所检索内容的相关性与逻辑一致性——当证据不足时触发迭代式检索,当检测到逻辑冲突时则调用“刷新者”(Refresher);“刷新者”进一步通过精准的定向更新或删除过时条目,强制保障记忆的一致性。在多个高难度长上下文基准测试上的大量实验表明,AMA显著优于当前最优基线方法;相较于全上下文方法,其令牌消耗降低约80%,充分证明了该框架在保障检索精度与长期记忆一致性方面的有效性。
-
- 图表
- 解决问题现有LLM代理记忆系统存在检索粒度僵化、维护策略冗余、更新机制粗糙等问题,导致存储信息与任务推理需求不匹配,并随时间累积逻辑不一致,难以支撑长周期、高复杂度的连贯推理与交互。
- 关键思路提出AMA(Adaptive Memory via Multi-Agent Collaboration)框架:通过角色化多智能体(Constructor, Retriever, Judge, Refresher)协同实现记忆的动态分层构建、任务自适应检索路由、实时相关性与一致性校验,以及冲突驱动的精准刷新(targeted update/removal),首次将记忆管理建模为可协作、可验证、可修正的闭环控制过程。
- 其它亮点在LongChat-7B和Llama-3-8B等模型上验证;测试于多个挑战性长上下文基准(如NarrativeQA-long、QuALITY-long、MemoryBank-Bench);相比全上下文方法降低约80% token消耗,同时提升准确率;未提及开源代码;亮点在于将‘记忆一致性’显式建模为可判定、可干预的状态,而非隐式依赖模型内部表示;未来可探索Judge/Refresher的轻量化蒸馏、跨任务记忆迁移、以及与世界模型的联合演进。
- Memory Networks (Weston et al., 2015); RETRO (Borgeaud et al., 2022); MEMIT (Meng et al., 2023); LTM (Chen et al., 2024); AgentGPT's episodic memory module; Thinker: A Self-Reflective Agent (2024); Self-RAG (Asai et al., 2023)
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流