Teaching Large Language Models to Express Knowledge Boundary from Their Own Signals

2024年06月16日
  • 简介
    大型语言模型(LLMs)取得了巨大的成功,但它们偶尔会编造内容,即幻觉,这限制了它们的实际应用。幻觉的产生是因为LLMs在知识边界的不足训练下难以承认无知。我们称之为LLMs的局限性,它们无法准确地表达自己的知识边界,回答他们知道的问题,同时承认对他们不知道的问题的无知。在本文中,我们旨在教导LLMs识别和表达他们的知识边界,以便在不知道答案时减少由于编造而导致的幻觉。我们提出了CoKE,它首先通过一组问题给出内部置信度来探测LLMs的知识边界,然后利用探测结果来引发知识边界的表达。广泛的实验表明,CoKE帮助LLMs表达知识边界,在回答已知问题的同时拒绝未知问题,显着提高了域内和域外的性能。
  • 作者讲解
  • 图表
  • 解决问题
    如何让大型语言模型能够准确表达自己的知识边界,避免内容捏造和幻觉?
  • 关键思路
    通过内部置信度探测大型语言模型的知识边界,然后利用探测结果引导大型语言模型表达知识边界。
  • 其它亮点
    论文提出了一种新方法CoKE,能够帮助大型语言模型表达知识边界,从而减少内容捏造和幻觉。实验表明,CoKE能够显著提高大型语言模型的领域内和领域外表现。
  • 相关研究
    最近在这个领域中,也有一些相关的研究。例如,"Language Models are Few-Shot Learners"和"GPT Understands, Too"等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问