- 简介随着大型语言模型(LLMs)的发展,开放域对话系统取得了显著的进展。然而,大多数现有的对话系统主要集中在简短的单次交互上,忽略了与聊天机器人进行长期陪伴和个性化交互的现实需求。解决这一现实需求的关键是事件总结和个性化管理,这使得适当的长期对话响应得以推理。最近,LLMs在人类认知和推理能力方面取得了进展,表明基于LLMs的代理人可以显著增强自动感知、决策和问题解决能力。针对这一潜力,我们介绍了一个模型无关的框架,即长期对话代理(LD-Agent),它包括三个独立可调的模块,分别用于事件感知、个性提取和响应生成。对于事件记忆模块,长期和短期记忆库分别用于关注历史和正在进行的会话,同时引入基于主题的检索机制以增强记忆检索的准确性。此外,个性模块对用户和代理人进行动态个性建模。随后,检索到的记忆和提取的个性被输入生成器中,以诱导适当的响应。LD-Agent的有效性、通用性和跨领域能力在各种说明性基准、模型和任务中得到了经验上的证明。代码已在https://github.com/leolee99/LD-Agent发布。
- 图表
- 解决问题本论文旨在解决现有对话系统在长期陪伴和个性化交互方面的不足,提出了一个LD-Agent框架,用于事件总结和角色管理,以实现适当的长期对话响应。
- 关键思路LD-Agent框架包括三个独立可调的模块,分别用于事件感知、角色提取和响应生成。事件存储模块使用长期和短期记忆库分别关注历史和进行中的对话,引入基于主题的检索机制以提高记忆检索的准确性。角色模块对用户和代理进行动态角色建模。检索到的记忆和提取的角色随后输入生成器以诱导适当的响应。
- 其它亮点本论文提出的LD-Agent框架在各种基准、模型和任务中展示了有效性、通用性和跨领域能力。代码已在GitHub上开源。
- 最近的相关研究包括OpenAI的GPT-3和Facebook的Blender,这些模型也是基于大型语言模型的对话系统,但LD-Agent框架的重点是在长期对话方面,具有更好的个性化和事件感知能力。
沙发等你来抢
去评论
评论
沙发等你来抢