中文命名实体识别ner数据_resume_bio格式 已经清理干净,放心下载,直接可以用各种ner模型训练
2021-06-03 14:36:23 190KB nlp 命名实体识别 中文
1
本资源是关系抽取公开数据集NYT,已经转成BIO格式,可直接用于端到端的关系抽取训练。
1
OntoNotes-5.0-NER-BIO 这是CoNLL-2003格式的版本,带有OntoNotes 5.0版本NER的BIO标记方案。 此格式化的版本基于的说明以及在此存储库中创建的新脚本。 简单地说,名为“(Yuchen Zhang,Zhi Zhong,CoNLL 2013),提出了针对OntoNotes 5.0数据的Train-dev-split,并提供了将其转换为CoNLL 2012格式的脚本。 但是,结果不在BIO标记方案中,不能直接用于许多序列标记体系结构中,例如BLSTM-CRF。 此回购协议通过直接生成BIO格式简化了预处理,您可以在实验中使用它们。 步骤1:获取官方的O
1
2006年sighan命名实体识别任务语料,MSRA提供。已经转成BIO格式,可直接用于NER训练
2019-12-21 20:29:10 7.18MB NER BIO格式 bakeoff2006 MSRA语料
1