Teaching Large Language Models to Express Knowledge Boundary from Their Own Signals

简介

大型语言模型（LLMs）取得了巨大的成功，但它们偶尔会编造内容，即幻觉，这限制了它们的实际应用。幻觉的产生是因为LLMs在知识边界的不足训练下难以承认无知。我们称之为LLMs的局限性，它们无法准确地表达自己的知识边界，回答他们知道的问题，同时承认对他们不知道的问题的无知。在本文中，我们旨在教导LLMs识别和表达他们的知识边界，以便在不知道答案时减少由于编造而导致的幻觉。我们提出了CoKE，它首先通过一组问题给出内部置信度来探测LLMs的知识边界，然后利用探测结果来引发知识边界的表达。广泛的实验表明，CoKE帮助LLMs表达知识边界，在回答已知问题的同时拒绝未知问题，显着提高了域内和域外的性能。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

如何让大型语言模型能够准确表达自己的知识边界，避免内容捏造和幻觉？
关键思路

通过内部置信度探测大型语言模型的知识边界，然后利用探测结果引导大型语言模型表达知识边界。
其它亮点

论文提出了一种新方法CoKE，能够帮助大型语言模型表达知识边界，从而减少内容捏造和幻觉。实验表明，CoKE能够显著提高大型语言模型的领域内和领域外表现。
相关研究

最近在这个领域中，也有一些相关的研究。例如，"Language Models are Few-Shot Learners"和"GPT Understands, Too"等。

Teaching Large Language Models to Express Knowledge Boundary from Their Own Signals

提问交流

提问交流