【论文标题】Generate Your Counterfactuals: Towards Controlled Counterfactual Generation for Text
【文本生成】生成您的反事实:走向受控的文本反事实生成(AAAI 2021)
【论坛网址】https://hub.baai.ac.cn/view/4903
【作者团队】Nishtha Madaan, Inkit Padhi, Naveen Panwar, Diptikalyan Saha
【发表时间】2020/12/8
【论文链接】https://arxiv.org/abs/2012.04698
【推荐理由】
本文收录于AAAI 2021会议,来自IBM研究院的研究人员提出一个生成反事实样本的框架生成相应条件的反事实文本样本用以测试人工智能系统的公平性和鲁棒性。
随着人工智能的发展,人工智能系统的可信度和可靠性对于它们能否做出公平且稳健的决定是至关重要的。因此,反事实文本可作为备用数据集用以评估这些系统的公平性和鲁棒性,这些反事实文本及其标签也可以用于训练用来减少模型的偏见。
反事实文本有四个重要的属性:合理性,多样性,目标导向性和有效性。但是现有的生成方法仅局限于特定领域,随着标签的改变,则会生成不合理,不合语法或需要人工干预文本。
因此,作者在本文通过保持反事实文本的四个属性的平衡来解决上述方法的缺点。在生成反事实样本的框架中,我们首先重建输入文本,然后引入于微分模型和不可微分模型一起使用的Loss函数,以强制执行相应的条件。此条件可以是:情感,NER,或者其他用户提供的类别标签。可微分Loss是根据输入语句的对数计算,不可微分Loss则取决于生成基于文本计算的奖励。此外,为了确保生成文本的多样性,作者在输入的logit上增加了熵,具体模型如图所示。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢