CLUEDatasetSearch
中英文NLP数据集。可以点击。
您可以通过贡献你的力量。上传五个或以上数据集信息并审核通过后,该同学可以作为项目贡献者,并显示出来。
如果数据集有问题,欢迎提出问题。
所有数据集均压缩网络,只做整理供大家提取方便,如果有缺陷等问题,请及时联系我们删除。
内尔
ID
标题
更新日期
数据集提供者
许可
说明
关键字
类别
论文地址
备注
1个
2017年5月
北京极目云健康科技有限公司
数据统计其云医院平台的真实电子病历数据,共计800条(个别病人单次就诊记录),经脱敏处理
电子病历
命名实体识别
\
中文
2
2018年
医渡云(北京)技术有限公司
CCKS2018的电子病历命名实体识别的评估任务提供了600份标注好的电子病历文本,共需识别含解剖部位,独立症状,症状描述,手术和药物五类实体
电子病历
命名实体识别
\
中文
3
\
MSRA
数据抽样MSRA,标注形式为BIO,共有46365条语料
姆斯拉
命名实体识别
\
中文
4
1998年1月
人民日报
数据来源为98年人民日报,标注形式为BIO,共有23061条语料
98人民日报
命名实体识
1