LeCaRD:中国法律案件检索数据集
概述
背景
勒加仑钙本身řetrieval d ataset(LeCaRD)含有106查询病例和超过43,000候选例。 查询和结果取自公布的刑事案件。 相关性判断标准和注释均由我们的法律专家团队进行。 对于数据集评估,我们在LeCaRD上实现了几种现有的检索模型作为基线。
项目结构
/LeCaRD/data是所有LeCaRD数据的根目录。 一些主要文件(或目录)的含义介绍如下:
data
├── candidates
│ └── candidates.zip // [important] candidate zipfile
├── corpus
│ ├── common_charge.json
│ ├── controversial_charge.json
│ └── documen
2021-11-29 21:15:31
81.8MB
Python
1