KnowHalu: Hallucination Detection via Multi-Form Knowledge Based Factual Checking

2024年04月03日
  • 简介
    本文介绍了KnowHalu,一种新颖的方法,用于检测大型语言模型(LLMs)生成的文本中的幻觉,利用分步推理、多种形式的查询、多种形式的知识进行事实检查和基于融合的检测机制。随着LLMs在各个领域的应用越来越广泛,确保它们的输出不是幻觉至关重要。鉴于现有方法的局限性,这些方法要么依赖于LLMs的自洽性检查,要么在不考虑查询的复杂性或知识形式的情况下执行事后事实检查,KnowHalu提出了一种用于幻觉检测的两阶段过程。在第一阶段,它识别出非制造幻觉——虽然事实上是正确的,但与查询无关或不具体的响应。第二阶段,基于多种形式的事实检查,包括五个关键步骤:推理和查询分解、知识检索、知识优化、判断生成和判断聚合。我们广泛的评估表明,KnowHalu在各种任务中检测幻觉的性能显著优于SOTA基线,例如在问答任务中提高了15.65%,在摘要任务中提高了5.50%,突显了其在检测LLM生成内容中的幻觉方面的有效性和通用性。
  • 作者讲解
  • 图表
  • 解决问题
    本论文旨在解决大型语言模型(LLMs)生成的文本中出现幻觉的问题,提出了一种新的检测方法。
  • 关键思路
    KnowHalu是一种基于多种形式的查询、多形式知识的事实检查和融合检测机制的幻觉检测方法。它通过两个阶段的过程来检测幻觉。
  • 其它亮点
    论文的实验结果表明,KnowHalu在不同任务中检测幻觉的性能显著优于现有的基线方法,例如在QA任务中提高了15.65%,在摘要任务中提高了5.50%。
  • 相关研究
    最近的相关研究包括使用自我一致性检查的方法和后期事实检查的方法,但这些方法都存在一定的局限性。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问