ERNIE 3.0中文预训练模型进行MSRA序列标注 文章链接:https://blog.csdn.net/sinat_39620217/article/details/125071909?csdn_share_tail=%7B%22type%22%3A%22blog%22%2C%22rType%22%3A%22article%22%2C%22rId%22%3A%22125071909%22%2C%22source%22%3A%22sinat_39620217%22%7D&ctrtid=UfDbk
2024-06-06 14:22:35 2KB 文档资料
1
abbrs 基于双层条件随机场的中文公司名简称生成 Flask架构,提供高可用的API服务 Argparse设计,便于命令操作 基于HMM的前向后向算法构建有向概率图 基于维特比算法构建的解析求解最大概率解 完整流程,从语料到训练集至模型生成 更多特性等你发现…… 组件介绍 分为两层处理,分类(classify)与切分(seg)。 classify 将公司名基于自定义类型做分类,为之后简称缩略模型提供支持以及规则模型提供支持 seg 利用classify结果结合其他特征来获取最终简称集合 目录介绍 project bin //中间交换结构 doc load //加载模型 preprocessor //预处理语语料 train //训练模型 util //工具 app.py //API入口 config.py //配置 环境准备 python环境 请使用python3环境进
2022-06-24 15:03:28 25KB Python
1
本文提出了一种基于循环神经网络的语义完整性分析方法,通过判断句子是否语义完整,将长文本切分成多个语义完整句.首先,对文本进行分词,映射为相应的词向量并进行标注,然后将词向量和标注信息通过循环窗口和欠采样方法处理后,作为循环神经网络的输入,经过训练最后得到模型.实验结果表明,该方法可以达到91.61%的准确率,为主观题自动评分工作提供了基础,同时对语义分析、问答系统和机器翻译等研究有一定的帮助.
1
序列标注的网络原始数据集
2022-03-03 21:50:22 1.31MB 数据集
1
NLP学习指南 本教程致力于帮助同学们快速入门NLP,并掌握各个任务的SOTA模型。 各任务模型列表汇总:,,,(todo), 各任务概述和技巧:,文本匹配,序列标注,文本生成,语言模型 之后就可以开始逐个击破,但也不用死磕,控制好目标难度,先用三个月时间进行第一轮学习: 读懂机器学习,深度学习原理,不要求手推公式 了解经典任务的基准,动手实践,看懂代码 深入一个应用场景,尝试自己修改模型,提升效果 迈过了上面这道坎后,就可以重新回归理论,提高对自己的要求,某种手推公式,盲写模型,拿到比赛Top等。 第一步:基础原理 机器学习最初入门时对数学的要求不是很高,掌握基础的线性代数,概率论就可以了,正常读下来的理工科大学生以上应该都没问题,可以直接开始学,碰到不清楚的概念再去复习。 统计机器学习部分,建议初学者先看懂线性分类,SVM,树模型和图模型,这里推荐李航的“统计学习方法”,薄的摸起来没有
2021-10-20 20:00:38 17KB
1
CwsPosNerEntityRecognition 中英文Cws Pos Ner实体识别工具,使用CNN双向lstm和crf模型,并带有char嵌入。基于字向量的CNN池化双向BiLSTM与CRF模型的网络,可能一体化的完成中文和英文分词,词性标注,实体识别。主要包括原始文本数据,数据转换,训练脚本,预训练模型,可用于序列标注研究。注意:唯一需要实现的逻辑是将用户数据转化为序列模型。分词准确率约为93%,词性标注准确率约为90%,实体标注(在本样本上)约为85%。 提示 中文分词,词性标注,实体识别,在使用上述模型时,本质是就是标注问题!!!如果您第一次使用相关的模型,只需加上self.c
2021-10-18 22:10:58 52.4MB nlp tensorflow crf keras
1
自然语言处理作业 ,实现序列标注、人名地名机构名的命名实体识别 Bi-LSTM+CRF条件随机场 pytorch实现 PS:资源的下载积分会随下载次数自动增加越来越多,如果您积分不够的话可以私信我重置下载分数
2021-06-21 14:49:02 10.33MB pytorch nlp 序列标注 BiLSTM
1
使用深度学习方法BiLSTM,并结合CRF模型的标签依赖性特点,解决命名实体识别的序列标注问题
2020-01-03 11:37:23 123KB BiLSTM-CRF Deep Learnin
1
中文NLP序列标注工具。利用CRF进行命名实体识别NER,自动标注数据集产生语料库,可以选择BIO或者BMES标注体系。
2019-12-21 19:58:54 9.85MB NLP CRF
1