命名实体识别conll 数据集-附件资源
2022-08-18 22:07:47 23B
1
Agricultural Knowledge Graph 由于工作原因,该项目已停止维护。因此项目代码仅供参考,项目中包含的数据可免费用于学术等非商业用途。 相关工作请引用paper: AgriKG: An Agricultural Knowledge Graph and Its Applications[C]. DASFAA (3) 2019: 533-537 项目介绍: 本项目是上海市《农业信息服务平台及农业大数据综合利用研究》子课题《上海农业农村大数据共享服务平台建设和应用》的研究成果。 该课题是由上海市农业委员会信息中心主持,以“致富农民、服务市民、提高行政管理效能”为目标,充分发挥大数据在农业农村发展中的重要功能和巨大潜力,重点建设上海市级农业农村大数据中心,促进信息资源的共建共享和创新应用。 华东师范大学数据科学与工程学院(以下简称华师大数据学院)作为课题主要参与单位以实现智慧农业为目标,探索农业大数据分析、挖掘和综合应用。华师大课题组在前期国家重点研发计划《大数据知识工程基础理论及其应用研究》研究基础上,在本项目中,基于碎片化农业大数据,构建面向智慧农业的知识图谱
2022-07-03 21:08:27 349.79MB 人工智能 农业 知识图谱 命名实体
CLUENER2020 中文细粒度命名实体识别 Fine Grained Named Entity Recognition
2022-07-03 21:08:26 452KB 人工智能 中文 细粒度 命名实体识别
NLP自然语言处理实验,简单搭建一个Bi-LSTM+CRF的中文分词框架,并且利用基于深度学习的方法进行中文命名实体识别。
2022-07-03 20:54:45 66.46MB 自然语言处理 深度学习 人工智能 nlp
# 中文命名实体识别 基于条件随机场(Conditional Random Field, CRF)的NER模型 ## 数据集 数据集用的是论文ACL 2018[Chinese NER using Lattice LSTM](https://github.com/jiesutd/LatticeLSTM)中收集的简历数据,数据的格式如下,它的每一行由一个字及其对应的标注组成,标注集采用BIOES,句子之间用一个空行隔开。 ``` 美 B-LOC 国 E-LOC 的 O 华 B-PER 莱 I-PER 士 E-PER 我 O 跟 O 他 O 谈 O 笑 O 风 O 生 O ``` 该数据集就位于项目目录下的`data`文件夹里。 ## 运行结果 具体的输出可以查看`output.txt`文件。 ## 环境 首先安装依赖项: pip3 install -r requirement.txt 安装完毕之后,直接使用 python3 main.py > output.txt 即可训练、评估以及测试模型,评估模型将会打印出模型的精确率、召回率、F1分数值以及混淆矩阵
2022-06-18 18:04:51 613KB NER NLP CRF 源码
1
人工智能-项目实践-实体识别-基于tensorflow深度学习的中文的命名实体识别 一个中文的实体命名识别系统 当前版本基于双向循环神经网络(BiRNN) + 条件随机场(CRF)来完成实体的标注。 基本思路是利用深度神经网络提取特征,从而避免了手动提取特征的麻烦。 第二部和传统的方式一样,使用CRF在做最后的标注。 该程序使用Tensorflow完成,使用了当前较新的DataSet API,使数据预处理和feed更优雅。 由于使用了新的API, Tensorflow版本必须大于1.2.0,代码升级后使用的是TensorFlow1.4,不确定原来Tensorflow1.2是否还兼容。
2022-05-26 12:05:53 337KB tensorflow 深度学习 机器学习 中文
代码来源:flyai 深度学习框架:tensorflow 公众号:深度学习视觉 完整代码获取:公众号后台回复(命名实体识别demo代码解读) 主要部分 Embedding input: 所有文字的字典文件,{index:word,…}; 所有文字的embedding文件,{word:embedding,…}; output: 将字典中的文字全部用embedding表示,{index:embedding}。 tensorflow提供索引的方式,每次索引对应word的embedding向量。 Dataset input_x:[batch_size,max_sentence_length,embe
2022-05-25 13:50:09 56KB demo em label
1
ner_elmo 用ELMO命名实体识别(语言模型的嵌入)
2022-05-23 15:01:03 9.11MB Python
1
anaGo anaGo是一个在Keras中实现的用于序列标记(NER,PoS标记等)的Python库。 anaGo可以解决序列标记的任务,例如命名实体识别(NER),词性标记(POS标记),语义anaGo anaGo是用于序列标记(NER,PoS标记等)的Python库,在Keras中实现。 anaGo可以解决序列标记任务,例如命名实体识别(NER),词性标记(POS标记),语义角色标记(SRL)等。 与传统的序列标签求解器不同,anaGo不需要定义任何语言相关的功能。 因此,我们可以轻松地将anaGo用于任何语言。 作为anaGo的示例,下图显示了英语的命名实体识别:
2022-05-19 16:40:14 5.91MB Python Deep Learning
1
本项目是在一个开源中文电子病历数据集上的命名实体识别(NER)任务的源码,其中包含了数据预处理、BERT-BiLSTM模型实现以及训练与测评的完整过程。本人有一篇博客是对其的详细说明,源码也注释详细,简单易读。
2022-05-12 15:19:20 1.5MB 自然语言处理 源码软件 人工智能 nlp