ByteRover: Agent-Native Memory Through LLM-Curated Hierarchical Context

向作者提问

NEW

简介

记忆增强生成（MAG）通过为大语言模型引入外部记忆机制，以支持长上下文推理；但现有方法普遍将记忆视为一种外部服务，由智能体主动调用，其存储功能则交由独立的处理流水线完成——包括文本分块、向量嵌入与图结构抽取等环节。这种架构上的割裂导致知识存储系统本身无法真正理解所存内容，进而引发三方面问题：一是智能体本意要记住的信息与其实际被流水线捕获的内容之间出现语义偏移；二是多个智能体之间缺乏对协同上下文的统一感知与共享；三是系统在发生故障后恢复能力脆弱、鲁棒性差。本文提出 ByteRover——一种面向智能体原生设计的记忆架构，其核心在于彻底重构记忆流水线：由同一台大语言模型既负责任务推理，也承担知识的采集、结构化组织与检索工作。ByteRover 将知识表征为一种分层的“上下文树”（Context Tree），即一种基于文件的知识图谱，按“领域（Domain）→ 主题（Topic）→ 子主题（Subtopic）→ 条目（Entry）”四级结构组织；每个条目均显式标注关联关系、来源出处，并配备一套自适应知识生命周期（Adaptive Knowledge Lifecycle, AKL）机制，该机制包含重要性评分、成熟度分级以及时效性衰减策略。在知识检索方面，ByteRover 采用五级渐进式策略：绝大多数查询可在毫秒级（低于100 ms）内完成，且无需调用大语言模型；仅当遇到全新、未覆盖的问题时，才升级至由智能体驱动的深度推理阶段。在 LoCoMo 和 LongMemEval 两个基准测试上的实验结果表明：ByteRover 在 LoCoMo 上达到当前最优（state-of-the-art）准确率，在 LongMemEval 上亦取得具有竞争力的表现；尤为关键的是，整个系统完全不依赖任何外部基础设施——无需向量数据库、无需图数据库、无需嵌入服务，所有知识均以人类可读的 Markdown 文件形式，直接存储于本地文件系统中。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

现有Memory-Augmented Generation（MAG）系统将记忆存储与推理解耦，依赖外部独立管道（如分块、嵌入、图抽取）管理知识，导致语义漂移、跨代理上下文断裂、故障恢复脆弱——即‘记忆系统不懂它存的内容’。这是一个尚未被充分重视的系统性架构缺陷问题，而非单纯性能或规模问题。
关键思路

提出ByteRover：首个代理原生（agent-native）内存架构，由同一LLM统一负责推理、记忆构建、结构化组织与检索；摒弃所有外部服务（向量库/图数据库/嵌入服务），用纯本地、人类可读的Markdown文件实现层级化Context Tree（Domain→Topic→Subtopic→Entry），并引入显式关系、溯源、自适应知识生命周期（AKL）及5级渐进式检索策略（95%+查询<100ms、免LLM调用）。
其它亮点

在LoCoMo（长上下文多跳推理基准）上达SOTA准确率，在LongMemEval上具竞争力；零外部依赖，全栈运行于本地文件系统；知识完全透明可审计（Markdown格式）；5级检索设计兼顾速度与泛化性；实验基于标准公开评测集LoCoMo和LongMemEval；论文未提代码开源状态（截至当前知识截止2024年中），但架构天然支持轻量部署；值得深入方向：AKL机制的跨任务迁移性、Context Tree的协同演化协议、多代理共享内存的一致性模型。
相关研究

MemoryGPT: Memory-Augmented Large Language Models; LTM-LLM: Long-Term Memory for LLMs via Hierarchical Indexing; MemGPT: Towards LLMs as Operating Systems with Virtual Context Management; RAG-Fusion: Retrieval-Augmented Generation with Query Rewriting and Fusion; GraphRAG: Modular Retrieval-Augmented Generation with Knowledge Graphs

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问