- 简介中文句子简化面临着挑战,因为缺乏大规模标注的平行语料库和习语的普遍存在。为了解决这些问题,我们提出了一种新的框架,名为“可读性引导的习语感知句子简化(RISS)”,将数据增强技术与词汇简化相结合。RISS引入了两个关键组件:(1)可读性引导的释义选择(RPS),一种挖掘高质量句子对的方法;(2)习语感知的简化(IAS),一种增强理解和简化习语表达的模型。通过使用多阶段和多任务学习策略将RPS和IAS集成起来,RISS在两个中文句子简化数据集上优于先前的最先进方法。此外,当在小型标记数据集上进行微调时,RISS实现了额外的改进。我们的方法展示了更有效和易于访问的中文文本简化的潜力。
-
- 图表
- 解决问题如何解决中文句子简化中缺乏大规模标记平行语料库和习语普遍存在的问题?
- 关键思路提出了基于可读性和习语的句子简化框架RISS,结合数据增强技术和词汇简化,引入了可读性引导的释义选择和习语感知简化两个关键组件,通过多阶段和多任务学习策略将这两个组件结合起来,取得了比之前最先进的方法更好的效果。
- 其它亮点RISS框架通过数据增强和词汇简化结合实现了中文句子简化,其中包括可读性引导的释义选择和习语感知简化两个关键组件。实验结果表明,RISS取得了比之前最先进的方法更好的效果,并且在小型标记数据集上进行微调后,效果进一步提升。
- 近期的相关研究包括:1)《A Neural Approach to Automated Chinese Sentence Simplification》;2)《Chinese Sentence Simplification with a Unified Sequence-to-Sequence Model》;3)《Simplifying Sentences with Pre-trained Transformers》等。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流