提取信用证700报文域信息,用于命名实体识别
这个代码主要是以条件随机场和长短期记忆为框架缩写的代码,代码较为复杂
2022-08-29 18:44:36 21KB python
1
命名实体识别conll 数据集-附件资源
2022-08-18 22:07:47 23B
1
Agricultural Knowledge Graph 由于工作原因,该项目已停止维护。因此项目代码仅供参考,项目中包含的数据可免费用于学术等非商业用途。 相关工作请引用paper: AgriKG: An Agricultural Knowledge Graph and Its Applications[C]. DASFAA (3) 2019: 533-537 项目介绍: 本项目是上海市《农业信息服务平台及农业大数据综合利用研究》子课题《上海农业农村大数据共享服务平台建设和应用》的研究成果。 该课题是由上海市农业委员会信息中心主持,以“致富农民、服务市民、提高行政管理效能”为目标,充分发挥大数据在农业农村发展中的重要功能和巨大潜力,重点建设上海市级农业农村大数据中心,促进信息资源的共建共享和创新应用。 华东师范大学数据科学与工程学院(以下简称华师大数据学院)作为课题主要参与单位以实现智慧农业为目标,探索农业大数据分析、挖掘和综合应用。华师大课题组在前期国家重点研发计划《大数据知识工程基础理论及其应用研究》研究基础上,在本项目中,基于碎片化农业大数据,构建面向智慧农业的知识图谱
2022-07-03 21:08:27 349.79MB 人工智能 农业 知识图谱 命名实体
CLUENER2020 中文细粒度命名实体识别 Fine Grained Named Entity Recognition
2022-07-03 21:08:26 452KB 人工智能 中文 细粒度 命名实体识别
NLP自然语言处理实验,简单搭建一个Bi-LSTM+CRF的中文分词框架,并且利用基于深度学习的方法进行中文命名实体识别
2022-07-03 20:54:45 66.46MB 自然语言处理 深度学习 人工智能 nlp
# 中文命名实体识别 基于条件随机场(Conditional Random Field, CRF)的NER模型 ## 数据集 数据集用的是论文ACL 2018[Chinese NER using Lattice LSTM](https://github.com/jiesutd/LatticeLSTM)中收集的简历数据,数据的格式如下,它的每一行由一个字及其对应的标注组成,标注集采用BIOES,句子之间用一个空行隔开。 ``` 美 B-LOC 国 E-LOC 的 O 华 B-PER 莱 I-PER 士 E-PER 我 O 跟 O 他 O 谈 O 笑 O 风 O 生 O ``` 该数据集就位于项目目录下的`data`文件夹里。 ## 运行结果 具体的输出可以查看`output.txt`文件。 ## 环境 首先安装依赖项: pip3 install -r requirement.txt 安装完毕之后,直接使用 python3 main.py > output.txt 即可训练、评估以及测试模型,评估模型将会打印出模型的精确率、召回率、F1分数值以及混淆矩阵
2022-06-18 18:04:51 613KB NER NLP CRF 源码
1
Entity Recognition of Traditional Chinese Medicine's Manual中药说明书实体识别。 Chinese:本数据集来源于中药药品说明书,通过挖掘中药说明书构建中药合理用药的知识图谱,将为中医规范诊疗奠定较好基础。抽取中药药品说明书中的关键信息可以帮助扩充中医药药品知识库。 疫情催化下,人工智能正在持续助力中医药传承创新加速发展,其中中医用药知识体系沉淀挖掘是一个基础工作。通过挖掘中药说明书构建中药合理用药的知识图谱,将为中医规范诊疗奠定较好基础。抽取中药药品说明书中的关键信息可以帮助扩充中医药药品知识库。
2022-06-12 14:08:10 5.42MB 中药识别 实体识别 模型
人工智能-项目实践-实体识别-基于tensorflow深度学习的中文的命名实体识别 一个中文的实体命名识别系统 当前版本基于双向循环神经网络(BiRNN) + 条件随机场(CRF)来完成实体的标注。 基本思路是利用深度神经网络提取特征,从而避免了手动提取特征的麻烦。 第二部和传统的方式一样,使用CRF在做最后的标注。 该程序使用Tensorflow完成,使用了当前较新的DataSet API,使数据预处理和feed更优雅。 由于使用了新的API, Tensorflow版本必须大于1.2.0,代码升级后使用的是TensorFlow1.4,不确定原来Tensorflow1.2是否还兼容。
2022-05-26 12:05:53 337KB tensorflow 深度学习 机器学习 中文
代码来源:flyai 深度学习框架:tensorflow 公众号:深度学习视觉 完整代码获取:公众号后台回复(命名实体识别demo代码解读) 主要部分 Embedding input: 所有文字的字典文件,{index:word,…}; 所有文字的embedding文件,{word:embedding,…}; output: 将字典中的文字全部用embedding表示,{index:embedding}。 tensorflow提供索引的方式,每次索引对应word的embedding向量。 Dataset input_x:[batch_size,max_sentence_length,embe
2022-05-25 13:50:09 56KB demo em label
1