CAIL 2025 | 中国法律智能技术评测正式开启，诚邀您参与！

复旦大学数据智能与社会计算实验室 2025-10-04 08:40 分享

以下文章来源于mp.weixin.qq.com

CAIL 2025一共设置6个任务，分别为：司法考试客观题、司法主观题考试、智能体法庭模拟、智能体模拟调解、法律数值计算、量刑情节识别与刑期预测，同时将提供海量司法文书数据作为数据集。

CAIL 2025预计将于2026年初举办颁奖典，诚邀学术界和工业界的研究者和开发者积极参与和支持评测！

CAIL 2025赛制说明
本届CAIL赛事采用三阶段赛制，三阶段分别为初赛阶段、复赛阶段、封测阶段。三阶段的赛制设计可以防止过度调参带来的模型过拟合，尽可能确保泛化性能强的模型取得较高的得分。选手的最终成绩将综合考虑三个阶段的表现得出。
1. 初赛阶段提供小规模数据集。选手需在小规模数据集上效果超过官方提供的Baseline，才能够进入到复赛阶段。
2. 复赛阶段将为选手提供全量的训练数据集，帮助选手更好地对模型进行调优。
3. 封测阶段要求选手提供模型，并用新的测试集评测模型的泛化性。

评测简介
近年来，随着以裁判文书为代表的司法大数据不断公开，以及自然语言处理技术的不断突破，如何将人工智能技术应用在司法领域，辅助司法工作者提升案件处理的效率和公正性，逐渐成为法律智能研究的热点。中国法律智能技术评测CAIL(Challenge of AI in Law)旨在为研究者提供交叉学科的学术交流平台，推动自然语言处理、智能信息检索等人工智能技术在法律领域的应用，共同促进中国法律智能技术的创新发展，为科技赋能社会治理作出贡献。
为了促进智能技术赋能司法，实现更高水平的数字正义，在最高人民法院和中国中文信息学会的指导下，从2018年起，CAIL已连续举办了六届中国法律智能技术评测，先后吸引了来自海内外高校、企业和组织的近5000支队伍参赛，成为中国法律智能技术评测的重要平台。CAIL 2018设置了罪名预测、法条推荐、刑期预测三个任务，并提供了包含268万刑事法律文书的数据集；CAIL 2019设置了阅读理解、要素识别、相似案例匹配三个任务；CAIL 2020设置了阅读理解、司法摘要、司法考试、论辩挖掘四个任务；CAIL 2021设置了阅读理解、类案检索、司法考试、司法摘要、论辩理解、案情标签预测、信息抽取七个任务；CAIL 2022设置了司法考试、事件检测、文书校对、类案检索、涉法舆情摘要、论辩理解、信息抽取、可解释类案匹配八个任务；CAIL 2023设置了司法考试、对话式类案检索、类案检索、事实认定、论辩理解、信息抽取、司法大模型七个任务；CAIL 2024设置了裁判文书事实生成、裁判文书说理生成、法律要素和争议焦点识别、二审改判类案检索与原因预测、法律咨询对话生成、司法客观题考试、多人多罪判决预测、司法主观题考试八个任务。随着智能技术与法律需求交叉融合的不断深入，CAIL的任务设置更加符合司法需求，任务难度也逐年升级。
大型语言模型在自然语言处理任务中取得了显著进展，并在法律领域展现了相当大的潜力。然而，法律应用在准确性、可靠性和公平性方面都有非常高的要求。在未仔细评估其潜力和局限性的情况下，将现有的大模型应用于法律系统，可能会对法律实践带来重大风险。为此，我们构建了法律认知能力评估框架，将司法大模型应当具备的能力分为六个层次，包括：记忆层、理解层、推理层、辨别层、生成层、伦理层。记忆能力评测，是评估模型记忆法律信息的能力，包括法律概念，法律规则，法律演变等；理解能力评测，是评估模型理解法律含义及其影响的能力，包括法律要素识别，法律事实验证，阅读理解，关系抽取，命名实体识别；逻辑推理能力评测，是评估模型运用法律事实进行逻辑推理的能力，包括案由预测，法条预测，刑期预测，多跳推理，法律计算，争辩挖掘等；辨别能力评测，是评估模型分析和判断法律信息的价值的能力，包括类案辨别，文档修正等；生成能力评测，是评估模型撰写专业的法律文件和论证性文本的能力，包括摘要生成，裁判分析过程生成，法律翻译，开放式问答等；伦理评测，是评估模型判断法律中的伦理问题的能力，包括偏见与歧视，道德，隐私。有关法律认知评估框架和司法大模型评估的更多内容，请参见论文LexEval（https://arxiv.org/abs/2409.20288）。
评测框架图

指导单位

主办单位

承办单位

赞助单位

指导委员会

程序委员会
评测委员会

联系我们
更多详细信息可以参考GitHub或者访问QQ群237633234了解。

扫描QQ二维码

点击下方“阅读原文”进入CAIL官网
注：本公众号原创文章的著作权均归属于清华大学互联网司法研究院，需转载请发送申请至邮箱thuij@mail.tsinghua.edu.cn，申请需注明拟转载公众号/网站名称、主理者基本信息、拟转载的文章标题等信息。
END
扫码关注我们

聚焦互联网司法科技研究
科技赋能法治现代化建设

内容中包含的图片若涉及版权问题，请及时与我们联系删除

点赞收藏评论分享到Link

沙发等你来抢

去评论