搜索【BI_LSTM】的结果

程序员5个刷题网站-keras-bert-ner:中文NER任务使用BiLSTM-CRF/BiGRU-CRF/IDCNN-CRF模型和预训练语

5个程序员刷题网站| 凯拉斯-伯特-纳中文 NER 任务使用BiLSTM-CRF/BiGRU-CRF/IDCNN-CRF模型和预训练语言模型的Keras解决方案：支持BERT/RoBERTa/ALBERT ）。更新日志 2020年2月27日重构的代码keras_bert_ner并删除了一些多余的文件。 bert4keras == 0.2.5现在已集成为该项目的主要部分。 2019.11.14 bert4keras现在作为一个包使用，因为它没有太大变化。 albert 模型现在只能支持谷歌的版本。 2019.11.04修复计算句子准确率和做预测时结果错误的问题。 2019.11.01将keras-contrib crf_accuracy/ crf_loss替换为自定义的 crf_accuracy/crf_loss 来处理掩码标签。未来的工作迁移到 tensorflow 2.0。添加其他 BERT 模型，例如 Distill_Bert、Tiny_Bert。依赖关系烧瓶== 1.1.1 keras == 2.3.1 numpy == 1.18.1 loguru == 0.4.1

2021-11-24 11:14:06 10.6MB 系统开源

1

ner:命名体识别（NER）综述-论文-模型-代码（BiLSTM-CRFBERT-CRF）-竞赛资源总结-随时更新-源码时代

背景介绍建了仓库，地址在这里：点star不迷路，相关文章在github上更新的会更交替一点QAQ 之前做过调整的命名体识别，项目背景实际上也很简单，就是我要做一个关键词匹配的功能，第一步我需要挖掘关键词。，明星领域，财经领域等等吧，这些领域的文本很有特色，一般人名/地名/公司名称/书名/电影名称都可以很好的表示文本关键信息。在这种项目背景之下，很自然的就会想到使用命名体识别。我把在做这个项目的过程中，积累的一些资料汇总了一下，希望对大家有所帮助。关于命名体识别，这是一个很大的领域，要做好，有很多工作要做。标题完全是为了能增加曝光，自己还是知道只是一个小学生，我会把自己看过的有用的东西都列出来，给大家提供一些先验信息。之后看到的关于nert的文章会在此基础继续更新（最近存了好多新文章还没看/苦逼码农/ QAQ），不过建议大家star一下Github，不迷路，我给自己的计划是精读一

2021-11-20 14:11:54 4KB 系统开源

1

BILSTM_CRF_NER-源码

BILSTM_CRF_NER 批处理的PyTorch实现支持双向LSTM-CRF。用法培训/测试数据的格式应如数据目录中所示：训练： python train.py 评估： python eval.py 其他 settings.py是定义参数的地方。 load_data.py实现了一个数据生成器，用于生成批量大小的张量。 pytorch_tutorial_vec.py是pytorch BiLSTM-CRF教程的矢量化版本。

2021-11-16 10:18:00 14.89MB Python

1

named_entity_recognition：中文命名实体识别（包括多种模型：HMM，CRF，BiLSTM，BiLSTM + CRF的具体实现）-源码

中文命名实体识别数据集本项目尝试使用了多种不同的模型（包括HMM，CRF，Bi-LSTM，Bi-LSTM + CRF）来解决中文命名实体识别问题，数据集用的是论文ACL 2018 中收集的简历数据，数据的格式如下，它的每个行由一个字及其对应的标注组成，标注集采用BIOES，句子之间用一个空行替换。美 B-LOC 国 E-LOC 的 O 华 B-PER 莱 I-PER 士 E-PER 我 O 跟 O 他 O 谈 O 笑 O 风 O 生 O 该数据集就位于项目目录下的ResumeNER文件夹里。运行结果下面是多种不同的模型以及这Ensemble这四个模型预测结果的准确率（取最好）： HMM 慢性肾功能衰竭双线性STM BiLSTM + CRF 合奏召回率 91.22％ 95.43％ 95.32％ 95.72％ 95.65％准确率 91.49％ 95.43％ 95.37％ 95.74％ 95.69％ F1分数 91.30％ 95.42％ 95.32％ 95.70％ 95.64％最后一列Ensemble是将这四个模型的预测结果结合起来，使用“

2021-11-13 17:18:20 24.44MB nlp hmm crf named-entity-recognition

1

基于BERT-BiLSTM-CRF模型的中文实体识别

命名实体识别是自然语言处理的一项关键技术. 基于深度学习的方法已被广泛应用到中文实体识别研究中. 大多数深度学习模型的预处理主要注重词和字符的特征抽取, 却忽略词上下文的语义信息, 使其无法表征一词多义, 因而实体识别性能有待进一步提高. 为解决该问题, 本文提出了一种基于BERT-BiLSTM-CRF模型的研究方法. 首先通过BERT模型预处理生成基于上下文信息的词向量, 其次将训练出来的词向量输入BiLSTM-CRF模型做进一步训练处理. 实验结果表明, 该模型在MSRA语料和人民日报语料库上都达到相当不错的结果, F1值分别为94.65%和95.67%.

2021-11-09 18:16:01 1.5MB 命名实体识别 BERT模型 双向长短期记忆网络 条件随机场

1

基于BERT+BiLSTM+CRF的中文景点命名实体识别

为解决旅游文本在特征表示时的一词多义问题, 针对旅游游记文本景点实体识别中景点别名的问题, 研究了一种融合语言模型的中文景点实体识别模型. 首先使用BERT语言模型进行文本特征提取获取字粒度向量矩阵, BiLSTM用于上下文信息的提取, 同时结合CRF模型提取全局最优序列, 最终得到景点命名实体. 实验表明, 提出的模型性能提升显著, 在实际旅游领域内景点识别的测试中, 与以往研究者方法比较下准确率, 召回率分别提升了8.33%, 1.71%.

2021-11-06 18:57:14 1.08MB BERT语言模型 BiLSTM 条件随机场 景点实体识别

1

NER-Sequence-labeling--Textcnn-bilstm-crf-pytorch:pytorch用Textcnn-bilstm-crf模型实现命名实体识别-源码

NER-Sequence-labeling--Textcnn-bilstm-crf-pytorch pytorch用Textcnn-bilstm-crf模型实现命名实体识别数据处理数据处理文件是'data_preprocess.py' 模型和训练过程模型和训练过程都在同一个文件中‘cnn-bilistm-crf.py’ 预测预测文件为‘predict.py’ 数据数据存在data文件夹中

2021-11-05 14:04:29 16KB Python

1

双向LSTM进行命名实体识别NER

2021-11-04 23:00:21 39.47MB 双向LSTM BiLSTM

1

基于SVM-BiLSTM-CRF模型的财产纠纷命名实体识别方法

裁判文书中的命名实体识别是自动化审判的关键一步，如何能够有效的分辨出案件的关键命名实体是本文的研究重点.因此本文针对财产纠纷审判案件，提出了一种基于SVM-BiLSTM-CRF的神经网络模型.首先利用SVM筛选出包含关键命名实体的句子，然后将正确包含此类实体的句子转化为字符级向量作为输入，构建适合财产纠纷裁判文书命名实体识别的BiLSTM-CRF深层神经网络模型.通过构建训练数据进行验证和对比，该模型比其他相关模型表现出更高的召回率和准确率.

2021-10-31 16:58:52 1.1MB 命名实体识别 SVM BiLSTM CRF

1

Min_NLP_Practice：使用CNN双向lstm和crf模型并带有char嵌入功能的中英文Cws Pos Ner实体识别工具。基于字向量的CNN池化双向BiLSTM与CRF模型的网络，可能的一体化完成标记，实体识别。主要包括原始文本数据，数据转换，训练脚本，预训练模型，可用于序列标注研究。注意：唯一需要实现的逻辑是将用户数据转换为序列模型。分词准确率约为93％，词性标注准确率约为90％，实体标注（在本样本上）约为85％-源码

CwsPosNerEntityRecognition 中英文Cws Pos Ner实体识别工具，使用CNN双向lstm和crf模型，并带有char嵌入。基于字向量的CNN池化双向BiLSTM与CRF模型的网络，可能一体化的完成中文和英文分词，词性标注，实体识别。主要包括原始文本数据，数据转换，训练脚本，预训练模型，可用于序列标注研究。注意：唯一需要实现的逻辑是将用户数据转化为序列模型。分词准确率约为93％，词性标注准确率约为90％，实体标注（在本样本上）约为85％。提示中文分词，词性标注，实体识别，在使用上述模型时，本质是就是标注问题！！！如果您第一次使用相关的模型，只需加上self.c

2021-10-18 22:10:58 52.4MB nlp tensorflow crf keras

1

个人信息

热门下载

最新下载

其他资源