【标题】RLET: A Reinforcement Learning Based Approach for Explainable QA with Entailment Trees
【作者团队】 Tengxiao Liu, Qipeng Guo, Xiangkun Hu, Yue Zhang, Xipeng Qiu, Zheng Zhang
【发表日期】2022.10.31
【论文链接】https://arxiv.org/pdf/2210.17095.pdf
【推荐理由】解释从问题到答案的推理过程对可解释的QA提出了挑战。最近提出的结构化推理格式,蕴涵树,能够在树状结构中提供明确的逻辑推理和蕴涵步骤。为了生成蕴涵树,先验的单遍序列到序列模型缺乏可见的内部决策概率,而逐步方法使用提取的单步数据进行监督,不能将树作为一个整体建模。本文提出了RLET,一种基于强化学习的蕴涵树生成框架,利用整个树的累积信号进行训练。RLET迭代执行带有句子选择和演绎生成模块的单步推理,训练信号通过精心设计的与评价一致的对齐奖励函数在树中积累。本文的研究是首次将RL引入蕴涵树生成任务。在EntailmentBank数据集的三种设置上的实验证明了使用此RL框架的优点。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢