Query-driven Relevant Paragraph Extraction from Legal Judgments

2024年03月31日
  • 简介
    法律专业人士经常需要处理冗长的法律判决,以确定直接回答他们问题的信息。本文关注于从法律判决中提取相关段落的任务,以回答查询。我们使用案例法指南从欧洲人权法院(ECtHR)构建了一个专门的数据集来完成此任务。我们以零-shot的方式评估了当前检索模型的性能,并建立了使用各种模型的微调基准。结果突显了微调和零-shot性能之间的显著差距,强调了处理法律领域分布转移的挑战。我们注意到,法律预训练处理语料库方面的分布转移,但仍然难以应对查询方面的分布转移,尤其是对于未见过的法律查询。我们还探索了各种参数高效微调(PEFT)方法,以评估它们在信息检索环境中的实用性,揭示了不同PEFT方法的有效性,预训练和模型架构影响PEFT方法的选择。
  • 作者讲解
  • 图表
  • 解决问题
    本论文旨在解决从法律判决中提取相关段落的问题,并评估当前检索模型的性能。
  • 关键思路
    通过使用欧洲人权法院的案例法指南构建专门的数据集,评估当前检索模型的零-shot性能,并建立各种模型的微调基准。结果表明,微调和零-shot性能之间存在显著差距,强调了处理法律领域分布转移的挑战。
  • 其它亮点
    实验结果显示,法律预训练可以处理语料库方面的分布转移,但仍然无法处理查询方面的分布转移。此外,作者还探索了各种参数高效微调(PEFT)方法,以评估它们在信息检索中的实用性,并揭示了不同PEFT方法在不同配置和预训练模型架构的有效性。
  • 相关研究
    最近的相关研究包括《Pre-Training Transformers as Energy-Based Cloze Models for Document Completion》和《Legal-BERT: The Muppets Strike Back》。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问