- 简介普通法法院需要参考类似判例的判决来指导他们当前的决定。生成高质量的法院判决文件摘要可以帮助法律从业人员高效地审查先前的案例,并帮助公众了解法院的运作方式和法律的适用。先前的法院判决摘要研究集中在民法或特定管辖区的判决上。然而,法官可以参考所有普通法管辖区的判决。当前的摘要数据集不足以满足跨多个管辖区摘要先例的需求,特别是对于许多管辖区来说,标记数据很少。为了解决数据集的缺乏,我们提出了CLSum,这是第一个用于摘要跨多个普通法法院判决文件的数据集。此外,这是第一个在数据增强、摘要生成和评估中采用大型语言模型(LLMs)的法院判决摘要工作。具体而言,我们设计了一种基于LLM的数据增强方法,结合了法律知识。我们还提出了一种基于LLM的法律知识增强评估指标,用于评估生成的判决摘要的质量。我们的实验结果验证了基于LLM的摘要方法在少样本和零样本设置中表现良好。我们基于LLM的数据增强方法可以缓解低数据资源的影响。此外,我们进行了全面的比较实验,以找到能够增强摘要性能的重要模型组件和设置。
- 图表
- 解决问题本论文旨在解决多司法管辖区共同法院判决文书的自动摘要问题,尤其是在数据资源匮乏的情况下。
- 关键思路论文提出了一种基于大型语言模型的数据增强方法,并采用LLM进行摘要生成和评估。实验结果表明,该方法在少样本和零样本情况下均能表现出色。
- 其它亮点本论文是第一个针对多司法管辖区共同法院判决文书的自动摘要数据集。同时,该论文采用了LLM进行数据增强、摘要生成和评估,提高了摘要的质量。实验结果表明,该方法在少样本和零样本情况下均能表现出色。
- 近期的相关研究包括针对民事法律或特定司法管辖区判决文书的自动摘要,例如《用于法律文件自动摘要的句子级语义关联》和《基于深度学习的中国法律文本摘要方法研究》。
沙发等你来抢
去评论
评论
沙发等你来抢