本项目是在一个开源中文电子病历数据集上的命名实体识别(NER)任务的源码,其中包含了数据预处理、BERT-BiLSTM模型实现以及训练与测评的完整过程。本人有一篇博客是对其的详细说明,源码也注释详细,简单易读。
2022-05-12 15:19:20 1.5MB 自然语言处理 源码软件 人工智能 nlp
Yidu-S4K 数据集源自CCKS 2019 评测任务一,即“面向中文电子病历的命名实体识别”的数据集,包括两个子任务:1)医疗命名实体识别;2)医疗实体及属性抽取(跨院迁移)。
1
Named Entity Recognition of CEMR is provided by Yidu Cloud.本数据集由医渡云提供。 subtask2_unlabeled.txt subtask1_test.zip subtask1_train.zip subtask2_test.zip subtask2_train.zip
2021-09-27 16:20:07 1.32MB 数据集
1