- 简介大型语言模型(LLMs)常常难以提供最新的信息,因为它们只进行一次训练,而世界的不断发展使得信息不断更新。为了使LLMs保持最新,现有的方法通常涉及对新文档的持续预训练。然而,它们经常面临提取存储知识的困难。受费曼技巧在高效人类学习中取得的显著成功的启发,我们引入了自我调整(Self-Tuning)学习框架,旨在通过自我教学来提高LLM有效地从原始文档中获取新知识的能力。具体而言,我们开发了一种自我教学策略,通过自监督方式创建一组知识密集型任务,重点关注三个关键方面:记忆、理解和自我反思。此外,我们引入了三个Wiki-Newpages-2023-QA数据集,以促进对LLM的知识获取能力进行深入分析,包括记忆、提取和推理。对Llama2系列模型的广泛实验结果表明,自我调整始终表现出卓越的性能,在所有知识获取任务中都表现出色,并擅长保留先前的知识。
-
- 图表
- 解决问题论文旨在解决LLMs在获取新知识方面的困难,以及如何保持先前知识的问题。这是否是一个新问题?
- 关键思路论文提出了一种名为Self-Tuning的学习框架,通过自我教育来改善LLMs从原始文档中有效获取新知识的能力。具体而言,论文提出了一种自我教学策略,通过自监督方式创建一组知识密集型任务,重点关注记忆、理解和自我反思三个关键方面。
- 其它亮点论文介绍了三个Wiki-Newpages-2023-QA数据集,以促进对LLMs知识获取能力的深入分析。实验结果表明,Self-Tuning在所有知识获取任务上都表现出优异的性能,并在保持先前知识方面表现出色。
- 近期在这个领域中,还有一些相关的研究,如《Continual Learning with Deep Generative Replay》、《Continual Learning Through Synaptic Intelligence》等。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流