用于命名实体识别(或序列标记)的LSTM-CRF模型 该存储库实现了用于命名实体识别的LSTM-CRF模型。 该模型与的模型相同,只是我们没有BiLSTM之后的最后一个tanh层。 我们在CoNLL-2003和OntoNotes 5.0英文数据集上均达到了SOTA性能(请通过使用Glove和ELMo来检查我们的,通过对BERT进行微调来检查其他)。 公告内容 我们实现了模块,该模块允许O(log N)推断和回溯! 通过微调BERT / Roberta **获得 模型 数据集 精确 记起 F1 基于BERT的情况+ CRF(此存储库) CONLL-2003 91.69 92.05 91.87 Roberta-base + CRF(此仓库) 2003年 91.88 93.01 92.44 基于BERT的情况+ CRF(此存储库) 笔记5 89.57 89.45
2022-02-14 23:46:06 50KB Python
1
利用CRF++进行中文分词 维护者: 维新公众号:Python爬虫与算法 语料 人民日报中文分词语料 微软中文分词语料 训练集与测试集的比例为9:1,具体的改写脚本可以参考read_segment_corpus.py。 CRF模型 工具采用CRF++,训练命令如下: crf_learn -f 3 -c 4.0 template train.data model -t 模型评估结果 accuary: 0.96405717503858 p: 0.9184067155248071 r: 0.9206969935013926 f1: 0.9195504284452864 classification report: precision recall f1-score support Char 0.92 0.92
2022-02-10 16:18:17 8.27MB 附件源码 文章源码
1
不错的三类工具包,这里分享下,里面有代码,以及我遇到的一些问题说明。
2022-02-09 14:13:47 3.95MB 条件随机场
1
使用tensorflow实现的中文实体识别LSTM+CRF(简单界面)
2022-01-25 14:13:19 14.77MB LSTM CRF
1
bilstmcrf.zip
2022-01-16 12:05:33 11KB bilstm-crf 命名实体识别
1
CRFSegment 用CRF++实现基于条件随机场模型的中文分词 更多详细介绍可以查看文章:
2022-01-15 09:46:08 2.37MB Perl
1
pycrfpp python CRF++实现分词 train and test 训练 训练数据采用1998年1月份人民日报的标注数据 tag => B M E S 训练模型调用接口 crf_model = CRFModel(model='model/model') crf_model.crf_learn(filename='data/199801\u4eba\u6c11\u65e5\u62a5.data') 参数model为保存模型的路径, filename为标注数据路径 测试 crf_model = CRFModel(model='model/model') data = crf_model.crf_test(tag_data=data) 测试结果 既往青霉素、链霉素、磺胺类药物过敏史<@>既_往_青霉素_、链_霉素、_磺_胺类_药物_过敏史 对“鸡蛋”等多种食物过敏<@>对_“鸡蛋”_等_多种_食物_过敏 对降脂药“非诺贝特
2022-01-12 10:21:27 38.55MB Python
1
当前基于油中溶解气体分析(DGA)的变压器故障诊断方法往往仅考虑单一时刻数据点,容错性差,难以充分挖掘在线监测数据的时序信息。提出一种考虑变压器油特征参量序列间复杂关系的基于双向长短时记忆(Bi-LSTM)网络的变压器故障诊断方法。首先构建了变压器油特征参量序列,基于序列数据构建了Bi-LSTM变压器故障诊断模型。工程实际中不同变压器油特征参量序列长短不一,需通过排序、分组填充对模型输入进行重构改进,然后对超参数进行优化。基于同一自建数据库对比所提方法与其他方法,结果表明:经过数据重构后所提方法的准确率可达91.9 %;当特征指标数量减少约2/3时,所提方法的准确率仅下降约1%,而其他方法的准确率平均下降约6 %;当采样数据存在10%的随机错误时,所提方法诊断准确率仅下降2%~6 %,且通过改变隐藏层的数量可得到改善。
1
条件随机场的推导和详细叙述
2021-12-17 17:07:53 319KB crf
1
PyDenseCRF 这是PhilippKrähenbühl (第2版,)的(基于Cython的)Python包装器。 如果您将此代码用于reasearch,请引用: Efficient Inference in Fully Connected CRFs with Gaussian Edge Potentials Philipp Krähenbühl and Vladlen Koltun NIPS 2011 并以脚注或引用的形式提供到此存储库的链接。 安装 该软件包位于PyPI上,因此只需运行pip install pydensecrf即可安装它。 如果您想要最新的版本,可以通过执行以下命令进行安装: pip install git+https://github.com/lucasb-eyer/pydensecrf.git 并忽略了来自本征的所有警告。 请注意,此包装器需要相对较新的Cython版本(至少0.22版),而Ubuntu 14.04随附的版本太旧。 (感谢Scott Wehrwein指出这一点。)我建议您使用并在那里安装最新版本的Cython( pip ins
2021-12-11 22:48:46 1.86MB machine-learning computer-vision crf cython
1