【标题】Dependency Parsing with Backtracking using Deep Reinforcement Learning

【作者团队】Franck Dary, Maxime Petit, Alexis Nasr

【发表日期】2022.6.28

【论文链接】https://arxiv.org/pdf/2206.13914.pdf

【推荐理由】NLP 的贪心算法(例如基于转换的解析)容易产生错误传播。克服这个问题的一种方法是允许算法回溯并在新证据与迄今为止探索的解决方案相矛盾的情况下探索替代解决方案。为了实现这种行为,本文使用强化学习并让算法回溯,以防这种行为比继续探索当前解决方案获得更好的回报。本文在 POS 标记和依赖解析上测试了这个想法,并表明回溯是对抗错误传播的有效手段。

内容中包含的图片若涉及版权问题,请及时与我们联系删除