python命名实体识别的demo以及训练字典,采用4-tag形式,准确率80以上
2019-12-21 20:56:03 12.14MB ner python
1
中文命名实体识别数据集,很好用。包括组织,机构和人物三个实体。
2019-12-21 20:49:05 1.81MB NLP NER
1
提供高中数学学科的知识数据集,包含6661个样本和706个实体,提供了基于该数据集的实体关系数据库(一共12种关系,11250个实体关系对)。该数据集可用于基于高中数学学科的知识图谱的构建,包含命名实体识别、实体关系抽取、文本分类等任务。
1
双向LSTM+CRF中文命名实体识别工具,可以使用自己的语料进行训练,欢迎大家交流学习。训练数据需要自己进行获取
2019-12-21 20:35:50 40.13MB 自然语言处理 命名实体识别
1
处理好的人民日报语料,用于命名实体识别,两个文件分别为字符集和词语级
2019-12-21 20:35:50 4.53MB 自然语言处理 命名实体识别
1
著名的Sighan Bakeoff语料。包含了训练集、测试集及测试集的(黄金)标准切分。
2019-12-21 20:35:03 2.33MB 命名实体识别 数据集
1
2006年sighan命名实体识别任务语料,MSRA提供。已经转成BIO格式,可直接用于NER训练
2019-12-21 20:29:10 7.18MB NER BIO格式 bakeoff2006 MSRA语料
1
中文NLP序列标注工具。利用CRF进行命名实体识别NER,自动标注数据集产生语料库,可以选择BIO或者BMES标注体系。
2019-12-21 19:58:54 9.85MB NLP CRF
1
基于crfsuited的医疗命名实体抽取的Python实现 医疗电子病例命名实体识别评测任务的一个可执行demo,采用的方法是条件随机场(CRF),实现CRF的第三方库为[python-crfsuite]。目前该demo准确率为68%,召回率为62%,F1值为64.8%。
2019-12-21 19:28:01 405KB CRF 命名实体识别 医疗
1
从深度学习的角度出发,提出了一种基于Attention 的双向长短时记忆网络(bidirectional long short-term memory,BLSTM)与条件随机场(conditional random fields,CRF)相结合的领域术语抽取模型(BLSTM_Attention_CRF 模型),并使用基于词典与规则相结合的方法对结果进行校正,准确率可达到 86%以上,该方法切实可行。
2019-12-21 19:28:01 1.48MB Attention CRF BLSTM 命名实体抽取
1