Plan, Generate and Complicate: Improving Low-resource Dialogue State Tracking via Easy-to-Difficult Zero-shot Data Augmentation

简介

数据增强方法一直是提高低资源对话状态跟踪小型模型性能的一个有前途的方向。然而，传统方法依赖于预定义的用户目标，并忽视了数据复杂性在这个任务中的重要性。本文提出了EDZ-DA，一种易于困难的零样本数据增强框架，用于低资源对话状态跟踪，利用大型语言模型自动捕捉不同领域之间的关系，然后生成对话数据。我们还根据领域关系复杂化对话，增强模型的共指槽跟踪能力。此外，我们对槽值进行排列组合，以减轻输出顺序的影响和不完整值生成的问题。实验结果表明，与MultiWOZ上之前强的数据增强基线相比，我们提出的方法具有优越性。
图表
解决问题

本文旨在提出一种针对低资源对话状态跟踪的数据增强框架，解决传统方法在忽略数据复杂度的情况下，仅依赖预定义用户目标的问题。
关键思路

EDZ-DA是一种Easy-to-Difficult Zero-shot数据增强框架，利用大型语言模型自动捕捉不同领域之间的关系，生成对话数据，并根据领域关系增加对话复杂度，从而提高模型的共指槽追踪能力。
其它亮点

本文的实验结果表明，与之前的数据增强基线相比，EDZ-DA方法在MultiWOZ数据集上的表现更优。此外，本文还使用了数据置换方法来减少输出顺序的影响和不完整值生成的问题。
相关研究

在最近的相关研究中，也有一些关于数据增强方法和低资源对话状态跟踪的研究，例如：Improving Dialogue State Tracking by Augmenting User Simulations with Real Dialogues; A Survey of Data Augmentation Approaches for NLP。

Plan, Generate and Complicate: Improving Low-resource Dialogue State Tracking via Easy-to-Difficult Zero-shot Data Augmentation

评论