- 简介法规检索旨在为特定查询找到相关的法规条款。这个过程是许多法律应用的基础,如法律咨询、自动化司法决策、法律文件起草等。现有的法规检索基准主要关注来自法律考试和法律案例文件等正式和专业的查询,因此忽略了来自一般公众的非专业查询,这些查询通常缺乏精确的法律术语和参考。为了解决这一差距,我们介绍了STARD数据集,这是一个包含1,543个来自真实法律咨询的查询案例和55,348个候选法规条款的中文数据集。与现有的法规检索数据集主要关注专业法律查询不同,STARD捕捉了来自一般公众的真实查询的复杂性和多样性。通过对各种检索基线的全面评估,我们揭示了现有的检索方法都不能满足非专业用户提出的这些真实查询的需求。最佳方法只能实现0.907的Recall@100,这表明在这个领域需要进一步探索和研究。所有代码和数据集都可在以下链接中找到:https://github.com/oneal2000/STARD/tree/main
- 图表
- 解决问题论文旨在解决针对非专业用户提出的法律查询的法规检索问题,这是当前法律应用中存在的一个新问题。
- 关键思路论文介绍了一个新的中文数据集STARD,其中包含来自真实法律咨询的1,543个查询案例和55,348个候选法规条款。作者通过对各种检索基线的全面评估,揭示了现有的检索方法均无法满足非专业用户提出的真实查询。论文提出了一种基于BERT的模型,通过将查询和法规条款表示为向量,并计算它们之间的相似度来解决这个问题。
- 其它亮点论文提出了一个新的中文数据集STARD,该数据集包含来自真实法律咨询的非专业用户查询案例。作者提出了一种基于BERT的模型来解决这个问题,并通过全面评估各种检索基线揭示了现有检索方法的不足。作者还提供了数据集和代码以供研究者使用。
- 最近在这个领域中,也有一些研究关注法规检索问题,如《Legal Information Retrieval with BERT》和《Learning to Retrieve Reasonable Statutes for Legal Questions》等。
沙发等你来抢
去评论
评论
沙发等你来抢