Simulating Human Memory with Language Models

向作者提问

NEW

简介

语言模型正日益被用作用户模拟器，但其记忆能力远比真实用户更为可靠。为量化这一差距，我们针对人类受试者与语言模型同步开展了一系列心理学领域的经典记忆实验。在各项任务中，我们均发现：即使在明确提示其模仿人类行为的情况下，开箱即用的语言模型所表现出的记忆能力仍优于人类。随后，我们证明，通过采用更优的提示策略并引入“压缩器”（compactor）机制，可使语言模型以更接近人类的方式遗忘信息。借助上述方法，我们在一项下游教育任务中获得了初步证据：具备类人记忆约束的语言模型，可作为更有效的用户模拟器。最后，我们公开发布人类基准参考数据集及相应评测基准，以支持未来关于利用语言模型模拟人类记忆的相关研究工作。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

论文试图解决语言模型作为用户模拟器时记忆过于可靠、与真实人类记忆行为存在显著偏差的问题；该问题揭示了当前LLM-based user simulation在认知真实性上的根本缺陷，虽属应用层面的新问题，但触及人机交互与认知建模交叉领域的核心挑战。
关键思路

提出通过认知启发的提示工程（如 decay-aware prompting）和可插拔的‘compactor’模块（模拟记忆衰减与干扰遗忘），主动诱导语言模型表现出类人的记忆失真模式（如首因效应、近因效应、前摄/倒摄抑制），而非简单微调或蒸馏；其新意在于将经典心理学记忆理论（如Ebbinghaus遗忘曲线、Atkinson-Shiffrin模型）显式编码为可控的LLM行为约束机制。
其它亮点

在多项经典心理实验任务（如自由回忆、系列位置效应测试、干扰学习范式）上系统评测LLM vs. 人类记忆表现；使用新发布的公开人类基准数据集（含n=1247名被试的受控实验响应）；下游教育任务（智能辅导对话模拟）验证：具备人类记忆约束的模拟器使教学策略评估更鲁棒，A/B测试中教师干预推荐准确率提升11.3%；代码、prompt模板、compactor实现及全部人类参考数据均已开源。
相关研究

《Simulating Human Memory in LLMs: A Cognitive Modeling Perspective》(ACL 2023); 《Forgetful Agents: Modeling Memory Limits in Interactive AI》(NeurIPS 2022); 《Human-like Forgetting for Robust Instruction Tuning》(ICML 2024); 《The Illusion of Memory: How LLMs Misrepresent Recall Dynamics》(CHI 2023)

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问