- 简介这项工作表明,通过使用合成数据生成技术增加训练数据的多样性,可以实现零-shot对话状态跟踪(DST)准确性的大幅提升。由于数据收集的高成本,当前的DST训练资源在涵盖应用领域和插槽类型方面严重受限,导致其在适应新领域方面受到限制。本文提出的工作通过一种新颖的全自动数据生成方法来创建合成的零-shot DST训练资源,克服了这一挑战。与以往用于生成DST数据的方法不同,本文提出的方法生成全新的应用领域以生成对话,包括银标注的对话状态和插槽描述。这种方法被用来创建D0T数据集,用于训练零-shot DST模型,涵盖了1000多个领域,创造了前所未有的记录。在MultiWOZ基准测试上进行的实验表明,使用多样化的合成数据训练模型可以使联合目标准确率提高6.7%,并取得了与更大模型相媲美的结果。
-
- 图表
- 解决问题如何提高零-shot对话状态跟踪(DST)的准确性?如何克服当前DST训练资源的限制,以便更好地适应新的应用领域和插槽类型?
- 关键思路通过使用合成数据生成技术增加训练数据的多样性,可以显著提高零-shot DST的准确性。提出了一种全新的、完全自动的数据生成方法,用于创建合成的零-shot DST训练资源,包括完整的应用领域、对话状态注释和插槽描述。通过这种方法创建的D0T数据集涵盖了1000多个领域。
- 其它亮点实验结果表明,使用多样化的合成数据训练模型可以提高6.7%的联合目标准确性,与更大的模型相比,结果具有竞争力。该论文的亮点包括:提出了一种新的合成数据生成方法,创造了规模庞大、多样化的D0T数据集,实现了令人印象深刻的结果。
- 最近的相关研究包括:《Zero-shot Dialogue State Tracking with Grouped Latent Actions》、《Improving Multi-Domain Dialogue State Tracking with Domain-Specific Ontologies and General-Domain Information》等。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流