- 简介法律专业人士经常需要处理冗长的法律判决,以确定直接回答他们问题的信息。本文关注于从法律判决中提取相关段落的任务,以回答查询。我们使用案例法指南从欧洲人权法院(ECtHR)构建了一个专门的数据集来完成此任务。我们以零-shot的方式评估了当前检索模型的性能,并建立了使用各种模型的微调基准。结果突显了微调和零-shot性能之间的显著差距,强调了处理法律领域分布转移的挑战。我们注意到,法律预训练处理语料库方面的分布转移,但仍然难以应对查询方面的分布转移,尤其是对于未见过的法律查询。我们还探索了各种参数高效微调(PEFT)方法,以评估它们在信息检索环境中的实用性,揭示了不同PEFT方法的有效性,预训练和模型架构影响PEFT方法的选择。
-
- 图表
- 解决问题本论文旨在解决从法律判决中提取相关段落的问题,并评估当前检索模型的性能。
- 关键思路通过使用欧洲人权法院的案例法指南构建专门的数据集,评估当前检索模型的零-shot性能,并建立各种模型的微调基准。结果表明,微调和零-shot性能之间存在显著差距,强调了处理法律领域分布转移的挑战。
- 其它亮点实验结果显示,法律预训练可以处理语料库方面的分布转移,但仍然无法处理查询方面的分布转移。此外,作者还探索了各种参数高效微调(PEFT)方法,以评估它们在信息检索中的实用性,并揭示了不同PEFT方法在不同配置和预训练模型架构的有效性。
- 最近的相关研究包括《Pre-Training Transformers as Energy-Based Cloze Models for Document Completion》和《Legal-BERT: The Muppets Strike Back》。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流