python NLTK识别字符串中的人名等,命名实体识别-附件资源
2021-10-25 19:26:16 23B
1
基于扩张神经网络(Divolved Convolutions)训练好的医疗领域的命名实体识别工具,这里主要引用模型源码,以及云部署方式供大家交流学习。 环境 阿里云服务器:Ubuntu 16.04 Python版本:3.6 Tensorflow:1.5 第一步:来一个Flask实例,并跑起来: 使用的是Pycharm创建自带的Flask项目,xxx.py from flask import Flask app = Flask(__name__) @app.route('/') def hello_world(): return 'Hello World!' if __name__ == '__main__': app.run() 执行python xxx.py就可以运行在浏览器中测试若直接在dos窗口中:输入命令也可测试。 第二部:服务器配置 服务器python版本为3.x 安装pi
2021-10-23 09:53:59 4.12MB Python
1
Neural (LSTM) version of the partial CRF model
2021-10-20 15:15:58 23KB Python开发-自然语言处理
1
LAnn标注工具 当前情况 目前为封闭域关系三元组标注,不提供新关系的标注,之前开放域关系三元组版本将不再维护,不再维护,不再维护,存在BUG!存在BUG!存在BUG!。 计划脱离对Django框架的依赖,借助PyQt的WebEngine实现标注界面和Python程序数据传输,更好地支持Pytorch和数据处理,已基本打通JS和Python之间的墙壁。 计划加入预训练BERT模型。 LAnn简介 LAnn(Little Annotator)是一个用于标注三元组的纯前段中文标注工具。具有使用简单的特点,采用网页的形式,使用浏览器便可运行。标注过程、结果直观,易后处理。基本不用配置,快速上手。可只用于NER标注,也可以适当修改,改为POS标注(实体类型改为词性,只进行实体标注)或者分词标注(设置特殊的实体类型“词语”,只进行实体标注)。 可以先后导入test.txt、entity_dict,然
2021-10-20 13:24:27 6.82MB vim annotator ner relation-extraction
1
中文命名实体识别数据集
2021-10-18 17:12:25 2.33MB 命名实体识别
1
本项目是自然语言处理NLP在中文文本上的一些简单应用,如文本分类、情感分析、命名实体识别等。 文本分类 数据集用的是头条的标题和对应文章分类数据。数据集来自这里: 文本分类的例子对应zh_article_classify_bilstm_attention.ipynb,这里构建的是BiLSTM+Attention的模型结构。 具体模型搭建如下: def create_classify_model(max_len, vocab_size, embedding_size, hidden_size, attention_size, class_nums): # 输入层 inputs = Input(shape=(max_len,), dtype='int32') # Embedding层 x = Embedding(vocab_size, embedding_size)(
2021-10-08 11:53:47 107.97MB 附件源码 文章源码
1
中文-DeepNER-Pytorch 天池中药说明书实体识别挑战冠军方案开源 贡献者: zxx飞翔​​的鱼: : 我是蛋糕王: : 数青峰: : 后续官方开放数据集后DeepNER项目会进行优化升级,包含完整的数据处理,训练,验证,测试,部署流程,提供详细的代码注释,模型介绍,实验结果,提供更普适的基础预训练的中文命名实体识别方案,开箱即用,欢迎星级! (代码框架基于火炬和变压器,框架进行性,解耦性,易读性较高,很容易修改迁移至其他NLP任务中) 环境 python3 . 7 pytorch == 1.6 . 0 + transformers == 2.10 . 0 pytorch - crf == 0.7 . 2 项目目录说明 DeepNER │ ├── data # 数据文件夹 │ ├── mid
2021-10-07 23:10:39 3.04MB Python
1
中文医学NLP公开资源整理:术语集/语料库/词向量/预训练模型/知识图谱/命名实体识别/QA/信息抽取/模型/论文/etc
2021-10-07 19:28:26 4KB 自然语言处理
1
为了获得更好的性能,您可以尝试NLPGNN,有关更多详细信息,请参见 。 BERT-NER版本2 使用Google的BERT进行命名实体识别(CoNLL-2003作为数据集)。 原始版本(有关更多详细信息,请参见old_version)包含一些硬代码,并且缺少相应的注释,因此不方便理解。 因此,在此更新版本中,有一些新的想法和技巧(关于数据预处理和图层设计)可以帮助您快速实现微调模型(您只需尝试修改crf_layer或softmax_layer)。 资料夹说明: BERT-NER |____ bert # need git from [h
2021-10-06 20:26:59 2.09MB tensorflow ner bert conll-2003
1
中国临床神经内科 CCKS2019中文命名实体识别任务。从医疗文本中识别疾病和诊断,解剖部位,影像检查,实验室检查,手术和药物6种命名实体。实现基于捷巴和AC自动机的基线构建,基于BiLSTM和CRF的序列标注模型构造。伯尔尼的部分代码源于感谢作者。模型最终测试集重叠0.81,还有更多改进空间。
2021-10-04 20:01:00 42.36MB 系统开源
1