Multi-Level Explanations for Generative Language Models

2024年03月21日
  • 简介
    本文关注于将LIME和SHAP等基于扰动的解释方法扩展到生成语言模型上。为了应对文本作为输出和长文本输入的挑战,我们提出了一个名为MExGen的通用框架,可以使用不同的归因算法实例化。为了处理文本输出,我们引入了标量化器的概念,将文本映射到实数,并研究了多种可能性。为了处理长输入,我们采用了多级方法,从较粗粒度到较细粒度进行处理,并关注具有模型查询线性扩展的算法。我们对扰动归因方法进行了系统评估,包括自动化和人类评估,用于总结和上下文相关的问答。结果表明,我们的框架可以提供更加局部准确的生成输出解释。
  • 图表
  • 解决问题
    本论文旨在解决生成语言模型中的解释问题,即如何对生成的文本结果进行解释,验证其准确性和可信度。
  • 关键思路
    论文提出了一个通用框架MExGen,可以基于不同的归因算法来解释生成语言模型的输出。为了解决文本输出和长文本输入的问题,论文引入了标量化器的概念来将文本映射为实数,并采用多级粒度的方法进行处理。
  • 其它亮点
    论文通过系统的实验评估了针对摘要和基于上下文的问答任务的扰动归因方法,结果表明该框架可以提供更加本地化的生成文本解释。
  • 相关研究
    与本论文相关的研究包括LIME和SHAP等扰动归因方法在文本分类中的应用,以及生成语言模型的解释方法研究。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论