对NER的监管不力 与ACL 2020接受的论文“没有标签数据的命名实体识别:弱监督方法”相关的源代码。 要求: 您首先应该确保安装以下Python软件包: spacy (版本> = 2.2) hmmlearn snips-nlu-parsers pandas numba scikit-learn 您还应该在Spacy中安装en_core_web_sm和en_core_web_md模型。 要在ner.py运行神经模型,还需要安装pytorch , cupy , keras和tensorflow 。 要运行基线,您还需要安装snorkel 。 最后,您还需要下载以下文件并将
1
自然语言处理中命名实体识别效果最好的方式,上述为原文
2021-08-25 10:32:44 814KB BI_LSTM CRF
1
命名实体识别(Named Entity Recognition,NER)作为自然语言处理领域经典的研究主题,是智能问答、知识图谱等任务的基础技术。领域命名实体识别(Domain Named Entity Recognition,DNER)是面向特定领域的NER方案。
2021-08-22 13:16:40 928KB #资源达人分享计划# 中文NER
1
此文档为博士论文,全面介绍了对中文自然语言进行处理的一些技术
2021-08-18 11:26:32 5.28MB 自然语言 核函数 实体关系 隐马尔科夫
1
使用Bert的中文NER BERT代表中文NER。 数据集列表 cner:数据集/ cner 主持人: : 型号清单 BERT + Softmax BERT + CRF BERT +跨度 需求 1.1.0 = <PyTorch <1.5.0 cuda = 9.0 python3.6 + 输入格式 输入格式(首选BIOS标记方案),每个字符的标签为一行。 句子用空行分隔。 美 B-LOC 国 I-LOC 的 O 华 B-PER 莱 I-PER 士 I-PER 我 O 跟 O 他 O 运行代码 在run_ner_xxx.py或run_ner_xxx.sh修改配置信息。 sh scripts/run_ner_xxx.sh 注意:模型的文件结构 ├── prev_trained_model | └── bert_base | | └── pytorch_model.bin | | └── config.json | | └── vocab.txt | | └── ...... CLUENER结果 BERT在dev上的整体性能: 准确性(实体) 召回(实
2021-08-17 16:54:16 484KB nlp crf pytorch chinese
1
行业分类-作业装置-一种中文医疗命名实体识别方法.zip
最新的hanlp的jar包,模型data包、配置文件hanlp.properties
2021-08-12 15:03:56 582.26MB hanlp NLP 自然语言处理 命名实体识别
1
课程目标: 学习完本门课程,您将对自然语言处理技术有更深入的了解,彻底掌握中文命名实体识别技术。 适用人群: 自然语言处理从业者、深度学习爱好者 课程简介: 命名实体识别作为自然语言处理的基础技术之一,在自然语言处理上游各个任务(问答系统、机器翻译、对话系统等)重扮演者十分重要的角色,因此深入掌握命名实体识别技术,是作为自然语言处理从业者毕本技能,本课程理论与实践相结合,希望能给大家带来帮助。 课程要求: (1)开发环境:Python3.6.5 Tensorflow1.13.1;(2)开发工具:Pycharm; (3)学员基础:需要一定的Python基础,及深度学习基础; (4)学院收货:掌握命名实体识别关键技术; (5)学院资料:见课程资料; (6)课程亮点:全程实战操作,徒手撸代码。
1
DuIE数据集,对原数据进行了清洗和重划分,可直接用于NER和RE任务训练
2021-08-07 12:06:15 72.87MB DuIE NER RE 命名实体识别
1
本文主要是对在线问诊中产生的医疗文本进行命名实体识别的研究.使用在线医疗问答网站的数据,采用{B,I,O}标注体系构建数据集,抽取疾病、治疗、检查和症状四个医疗实体.以BiLSTM-CRF为基准模型,提出两种深度学习模型IndRNN-CRF和IDCNN-BiLSTM-CRF,并在自构建数据集上验证模型的有效性.将新提出的两种模型与基准模型通过实验对比得出:模型IDCNN-BiLSTM-CRF的F1值0.8116,超过了BiLSTM-CRF的F1值0.8009,IDCNN-BiLSTM-CRF整体性能好于BiLSTM-CRF模型;模型IndRNN-CRF的精确率0.8427,但该模型在召回率上低于基准模型BiLSTM-CRF.
1