已经标记号label的中文命名实体识别的语料库,采用BIM标志形式。包括人名(PERSON)、地点(LOCATION)、时间(TIME)及机构名(ORGANIZATION)。
2019-12-21 21:06:55 17.29MB nlp NER 命名实体识别
1
BIO标注集,即B-PER、I-PER代表人名首字、人名非首字,B-LOC、I-LOC代表地名首字、地名非首字,B-ORG、I-ORG代表组织机构名首字、组织机构名非首字,O代表该字不属于命名实体的一部分。
2019-12-21 21:05:20 7.19MB NER 语料
1
python命名实体识别的demo以及训练字典,采用4-tag形式,准确率80以上
2019-12-21 20:56:03 12.14MB ner python
1
中文命名实体识别数据集,很好用。包括组织,机构和人物三个实体。
2019-12-21 20:49:05 1.81MB NLP NER
1
2006年sighan命名实体识别任务语料,MSRA提供。已经转成BIO格式,可直接用于NER训练
2019-12-21 20:29:10 7.18MB NER BIO格式 bakeoff2006 MSRA语料
1
用于HMM中文分词训练,代码可以参见:https://blog.csdn.net/qq_38593211/article/details/81637029
2019-12-21 18:53:49 16.62MB NLP NER
1