Zep: A Temporal Knowledge Graph Architecture for Agent Memory

2025年01月20日
  • 简介
    我们介绍了Zep,这是一种新型的记忆层服务,专为AI代理设计,在深度记忆检索(DMR)基准测试中超越了当前最先进的系统MemGPT。此外,Zep在比DMR更全面和更具挑战性的评估中表现出色,这些评估更能反映现实世界中的企业用例。现有的基于大型语言模型(LLM)的代理所使用的检索增强生成(RAG)框架仅限于静态文档检索,而企业应用则需要从包括正在进行的对话和业务数据在内的多种来源动态整合知识。Zep通过其核心组件Graphiti——一种具有时间感知能力的知识图谱引擎——解决了这一根本局限。Graphiti能够动态合成非结构化的对话数据和结构化的业务数据,同时保持历史关系。 在由MemGPT团队设立为主要评估指标的DMR基准测试中,Zep展示了卓越的性能(94.8%对93.4%)。除了DMR之外,Zep的能力还在更具挑战性的LongMemEval基准测试中得到了进一步验证,该测试通过复杂的时序推理任务更好地反映了企业用例。在这个评估中,Zep取得了显著成果,准确率提高了多达18.5%,同时将响应延迟减少了90%,相较于基线实现。这些结果在诸如跨会话信息合成和长期上下文维护等对企业至关重要的任务中尤为明显,证明了Zep在实际应用部署中的有效性。
  • 图表
  • 解决问题
    该论文试图解决现有检索增强生成(RAG)框架在大型语言模型(LLM)基础上的局限性,特别是静态文档检索无法满足企业应用中对动态知识整合的需求。这是一个新问题,特别是在企业环境中,需要处理来自多种来源的动态数据,包括持续的对话和业务数据。
  • 关键思路
    论文的关键思路是引入Zep,一个新型的记忆层服务,其核心组件Graphiti是一个时间感知的知识图引擎。Graphiti能够动态地整合非结构化的对话数据和结构化的业务数据,同时保持历史关系。这与现有的静态文档检索系统不同,Zep旨在应对更复杂的、反映真实世界企业需求的任务。
  • 其它亮点
    论文的亮点包括:1) Zep在Deep Memory Retrieval (DMR)基准测试中表现出色,超越了当前最先进的MemGPT;2) 在更复杂且更能反映实际应用场景的LongMemEval基准测试中,Zep不仅提高了准确性(最高达18.5%),还大幅减少了响应延迟(减少90%);3) 实验设计涵盖了跨会话信息合成和长期上下文维护等关键任务,这些都是企业应用中的难点;4) 论文提到Zep特别适用于需要动态知识整合的企业场景,如客服和支持系统。
  • 相关研究
    最近的相关研究包括:1) MemGPT团队开发的DMR基准测试,用于评估记忆系统的性能;2) 各种基于RAG的框架,如Retriever-Reader模型,专注于从静态文档中检索信息;3) 动态知识图谱的研究,例如《Temporal Knowledge Graph Completion via Continuous-Time Representation》;4) 大型语言模型的改进,如《Improving Long-Term Context Understanding in LLMs》,这些研究都为Zep的设计提供了理论基础和技术支持。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论