基于BERT的中文数据集下的命名实体识别(NER) 基于tensorflow官方代码修改。 环境 Tensorflow:1.13 的Python:3.6 tensorflow2.0会报错。 搜狐比赛 在搜狐这个文本比赛中写了一个基准,使用了bert以及bert + lstm + crf来进行实体识别。 其后只使用BERT的结果如下,具体评估方案请看比赛说明,这里的话只做了实体部分,情感全部为POS进行的测试嘲笑。 使用bert + lstm + crf结果如下 训练验证测试 export BERT_BASE_DIR=/opt/hanyaopeng/souhu/data/chinese_L-
2022-03-24 12:22:48 1.7MB nlp deeplearning ner bert
1
语义理解/口语理解,项目包含有词法分析:中文分词、词性标注、命名实体识别;口语理解:领域分类、槽填充、意图识别。
2022-03-22 16:05:31 3KB Python开发-自然语言处理
1
斯坦福NLP的信息提取,包括命名实体识别和关系提取等。
2022-03-16 16:20:42 318KB NER NLP
1
工具介绍 LAC全称中文的词法分析,是百度自然语言处理部研发的一种联合的词法分析工具,实现中文分词,词性标注,专名识别等功能。该工具具有以下特点和优势: 效果好:通过深度学习模型联合学习分词,词性标注,专名识别任务,单词索引,整体效果F1值超过0.91,词性标注F1值超过0.94,专名识别F1值超过0.85,效果领先。 效率高:精简模型参数,结合Paddle预测库的性能优化,CPU单线程性能达800QPS,效率领先。 可定制:实现简单可控的干预机制,精确匹配用户字典对模型进行干预。 调用便捷:支持一键安装,同时提供了Python,Java和C ++调用接口与调用示例,实现快速调用和集成。 支持
1
Lattice LSTM中文命名实体识别采用PyTorch实现
2022-03-04 20:40:19 336KB Python开发-机器学习
1
命名实体识别实战(BERT)-附件资源
2022-03-03 02:47:27 23B
1
基于nltk的英文地区提取算法,用python编写,输出结果为json,可被Java发送http请求调用
2022-03-01 14:34:59 968B 地区提取 命名实体识别 fastapi nltk
1
命名实体识别在摩洛哥旅游语料库中的应用
2022-02-21 09:29:00 98KB 旅游
Hybrid Bi-LSTM-CRF命名实体识别
2022-02-19 10:44:24 32KB Python开发-机器学习
1
用于命名实体识别(或序列标记)的LSTM-CRF模型 该存储库实现了用于命名实体识别的LSTM-CRF模型。 该模型与的模型相同,只是我们没有BiLSTM之后的最后一个tanh层。 我们在CoNLL-2003和OntoNotes 5.0英文数据集上均达到了SOTA性能(请通过使用Glove和ELMo来检查我们的,通过对BERT进行微调来检查其他)。 公告内容 我们实现了模块,该模块允许O(log N)推断和回溯! 通过微调BERT / Roberta **获得 模型 数据集 精确 记起 F1 基于BERT的情况+ CRF(此存储库) CONLL-2003 91.69 92.05 91.87 Roberta-base + CRF(此仓库) 2003年 91.88 93.01 92.44 基于BERT的情况+ CRF(此存储库) 笔记5 89.57 89.45
2022-02-14 23:46:06 50KB Python
1