- 简介人工智能记忆——即模型如何组织与检索历史消息——对大语言模型(LLM)而言正变得日益重要;然而,现有方法(如RAG和Graph-RAG)主要依赖基于相似度的机制进行记忆检索。这类“系统1”式检索虽效率较高,但在需要全局推理或须全面覆盖所有相关信息的场景下却力不从心。本文提出一种名为Mnemis的新型记忆框架,它将“系统1”式的相似性搜索与一种互补的“系统2”式机制——即“全局选择”(Global Selection)——有机融合。Mnemis将记忆组织为两类图结构:一类是用于相似性检索的基础图(base graph),另一类是支持自上而下、审慎遍历语义层级的分层图(hierarchical graph)。通过协同发挥两种检索路径各自的互补优势,Mnemis能够同时兼顾语义相关性与结构相关性,从而更精准地检索出所需记忆项。在长期记忆基准测试中,Mnemis全面超越所有对比方法,取得当前最优性能:在LoCoMo基准上得分为93.9,在LongMemEval-S基准上得分为91.6(均基于GPT-4.1-mini模型)。
-
- 图表
- 解决问题现有LLM记忆检索方法(如RAG、Graph-RAG)依赖纯相似性匹配(System-1式直觉检索),难以支持需全局推理、跨层级整合或穷尽式覆盖的复杂记忆任务,尤其在长程、结构化、多跳语义场景下表现受限;这是一个尚未被系统解决的新问题——即如何协同快速联想与慢速、可控、层次化的深度检索。
- 关键思路提出Mnemis框架,首次将双系统认知范式(Kahneman)形式化引入LLM记忆架构:在保留基于图的相似性检索(base graph, System-1)基础上,新增可遍历的语义层次图(hierarchical graph)实现自顶向下的Global Selection(System-2);二者联合检索确保结果兼具语义邻近性与结构完备性,突破单一相似度驱动的局部性瓶颈。
- 其它亮点在LoCoMo(93.9)和LongMemEval-S(91.6)上显著超越所有基线(含Graph-RAG、MemGPT、Self-RAG),使用GPT-4.1-mini验证泛化性;实验设计涵盖跨会话追踪、多文档溯源、层级问答三类长程推理任务;论文未提及其开源状态,但明确构建了可扩展的双图内存索引机制;值得深入的方向包括:层次图的动态构建策略、System-2检索的计算开销优化、以及人类反馈对Global Selection路径的对齐学习。
- 1. Graph-RAG: Combining Graph Neural Networks with Retrieval-Augmented Generation (2023) 2. MemGPT: Towards LLMs as Operating Systems (2023) 3. Self-RAG: Learning to Retrieve, Generate, and Critique through Self-Reflection (2023) 4. HippoRAG: Hierarchical Progressive Retrieval-Augmented Generation (2024) 5. Tree-of-Thought Prompting for Large Language Models (2023)
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流