更多模型和代码,参考:
:)
嗷嗷嗷,有缘再见呀。。。。。。。
中国法研杯比赛
法律数据集
文件组成
cail2018_big.json: 171w
数据组成
数据中涉及 183个法条、202个罪名,均为刑事案件
数据清洗
数据中筛除了刑法中前101条(前101条并不涉及罪名),并且为了方便进行模型训练,将罪名和法条数量少于30的类删去。
数据格式
数据利用json格式储存,每一行为一条数据,每条数据均为一个字典
字段及意义
fact: 事实描述
meta: 标注信息,标注信息中包括:
criminals: 被告(数据中均只含一个被告)
punish_of_money: 罚款(单位:元)
accusation: 罪名
relevant_articles: 相关法条
term_of_imprisonment: 刑期
刑期格式(单位:月)
death_penalty: 是否死刑
life_im
2021-10-17 16:00:34
64KB
Python
1