Mnemis: Dual-Route Retrieval on Hierarchical Graphs for Long-Term LLM Memory

向作者提问

NEW

简介

人工智能记忆——即模型如何组织与检索历史消息——对大语言模型（LLM）而言正变得日益重要；然而，现有方法（如RAG和Graph-RAG）主要依赖基于相似度的机制进行记忆检索。这类“系统1”式检索虽效率较高，但在需要全局推理或须全面覆盖所有相关信息的场景下却力不从心。本文提出一种名为Mnemis的新型记忆框架，它将“系统1”式的相似性搜索与一种互补的“系统2”式机制——即“全局选择”（Global Selection）——有机融合。Mnemis将记忆组织为两类图结构：一类是用于相似性检索的基础图（base graph），另一类是支持自上而下、审慎遍历语义层级的分层图（hierarchical graph）。通过协同发挥两种检索路径各自的互补优势，Mnemis能够同时兼顾语义相关性与结构相关性，从而更精准地检索出所需记忆项。在长期记忆基准测试中，Mnemis全面超越所有对比方法，取得当前最优性能：在LoCoMo基准上得分为93.9，在LongMemEval-S基准上得分为91.6（均基于GPT-4.1-mini模型）。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

现有LLM记忆检索方法（如RAG、Graph-RAG）依赖纯相似性匹配（System-1式直觉检索），难以支持需全局推理、跨层级整合或穷尽式覆盖的复杂记忆任务，尤其在长程、结构化、多跳语义场景下表现受限；这是一个尚未被系统解决的新问题——即如何协同快速联想与慢速、可控、层次化的深度检索。
关键思路

提出Mnemis框架，首次将双系统认知范式（Kahneman）形式化引入LLM记忆架构：在保留基于图的相似性检索（base graph, System-1）基础上，新增可遍历的语义层次图（hierarchical graph）实现自顶向下的Global Selection（System-2）；二者联合检索确保结果兼具语义邻近性与结构完备性，突破单一相似度驱动的局部性瓶颈。
其它亮点

在LoCoMo（93.9）和LongMemEval-S（91.6）上显著超越所有基线（含Graph-RAG、MemGPT、Self-RAG），使用GPT-4.1-mini验证泛化性；实验设计涵盖跨会话追踪、多文档溯源、层级问答三类长程推理任务；论文未提及其开源状态，但明确构建了可扩展的双图内存索引机制；值得深入的方向包括：层次图的动态构建策略、System-2检索的计算开销优化、以及人类反馈对Global Selection路径的对齐学习。
相关研究

1. Graph-RAG: Combining Graph Neural Networks with Retrieval-Augmented Generation (2023) 2. MemGPT: Towards LLMs as Operating Systems (2023) 3. Self-RAG: Learning to Retrieve, Generate, and Critique through Self-Reflection (2023) 4. HippoRAG: Hierarchical Progressive Retrieval-Augmented Generation (2024) 5. Tree-of-Thought Prompting for Large Language Models (2023)

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问