近年来,文本的情感分析一直都是自然语言处理领域所研究的热点问题;微博作为一种短文本,用词精炼而简洁,富含观点、倾向和态度。因此,识别微博的情感倾向具有重要的现实意义。提出一种基于SVM和CRF的情感分析方法,使用多种文本特征,包括词、词性、情感词、否定词、程度副词和特殊符号等,并选用不同的特征组合,通过多组实验使情感分析效果最优。实验显示,选用词性、情感词和否定词的特征组合时,SVM模型的正确率达到88.72%,选用情感词、否定词、程度副词和特殊符号的特征组合时,CRF模型的正确率达到9044%。
1
CRF++工具包(Linux&Windows版本)0.53版
2022-12-27 03:35:17 1.21MB CRF 条件随机场 Linux Windows
1
matlab说话代码玛宝 基于边际的条件随机场参数学习。 概述 此实现大致与本文中描述的算法相对应: Justin Domke,《 IEEE模式分析交易》,2013年。 入门 确保您具有支持C ++ 11的编译器。 已知可以使用最新版本的g ++和clang ++。 如果需要并行处理,请安装openMPI和/或验证编译器是否支持openMP。 (可选;请参见下文) 下载。 转到主代码目录,然后以两种方式编辑make.sh脚本。 将compiler变量更改为适合您的系统的变量。 将mpi_compiler变量设置为系统的一个(默认情况下通常为OK)。 运行make.sh脚本。 这将编译libLBFGS并将其安装到本地目录,然后构建infer_MRF , infer_CRF , learn_CRF和(如果已安装MPI的话) learn_CRF_mpi可执行文件。 仔细阅读其中的一些内容,以了解您的工作状况。 阅读 。 请注意,Marbl已在Mac OS和Linux下进行了编译,但尚未在Windows下进行过测试。 如果您能够在Windows下进行编译,请发送有关如何进行编译的任何信息。 要
2022-09-26 07:33:51 2.57MB 系统开源
1
基于条件随机场对中文案件语料进行命名实体识别。在学习知识图谱理论课时,我们知道实体(Entity)是知识图谱的基本单位,也是承载信息的重要语言单位。实体识别是知识图谱应用的重要技术。目前实体识别主要有三种方法: 基于规则和词典的实体识别 基于统计机器学习的实体识别 基于深度学习神经网络的实体识别 条件随机场(Conditional random field,CRF)是一种条件概率分布模型 P(Y|X) ,表示的是给定一组输入随机变量 X 的条件下另一组输出随机变量 Y 的马尔可夫随机场。 CRF 是一个序列化标注算法(sequence labeling algorithm),接收一个输入序列如X=(x1, x2,…, xn)并且输出目标序列Y=(y1, y2,…, yn)  ,也能被看作是一种seq2seq模型。这里使用大写 X,Y 表示序列。例如,在词性标注任务中,输入序列为一串单词,输出序列就是相应的词性。 除了词性标注之外,CRF还可以用来做chunking,命名实体识别等任务。一般地,输入序列X被称为 observations, Y叫作 states。
1
产生式模型和判别式模型(Generative model vs. Discriminative model),概率图模型(Graphical Models),朴素贝叶斯分类器( Naive Bayes Classifier),隐马尔可夫模型(Hidden Markov Model,HMM),最大熵模型(Maximum Entropy Model,MEM),最大熵马尔可夫模型(MEMM),条件随机场(conditional random fields,CRF)
2022-03-28 16:33:16 2.39MB 条件随机场 CRF HMM MEM
1
不错的三类工具包,这里分享下,里面有代码,以及我遇到的一些问题说明。
2022-02-09 14:13:47 3.95MB 条件随机场
1
条件随机场的推导和详细叙述
2021-12-17 17:07:53 319KB crf
1
命名实体识别是自然语言处理的一项关键技术. 基于深度学习的方法已被广泛应用到中文实体识别研究中. 大多数深度学习模型的预处理主要注重词和字符的特征抽取, 却忽略词上下文的语义信息, 使其无法表征一词多义, 因而实体识别性能有待进一步提高. 为解决该问题, 本文提出了一种基于BERT-BiLSTM-CRF模型的研究方法. 首先通过BERT模型预处理生成基于上下文信息的词向量, 其次将训练出来的词向量输入BiLSTM-CRF模型做进一步训练处理. 实验结果表明, 该模型在MSRA语料和人民日报语料库上都达到相当不错的结果, F1值分别为94.65%和95.67%.
1
新闻报道中观点能够影响读者的感受,针对目前新闻报道中观点提取缺失的现状。本文提出一种条件随机场(CRF)和深度学习相结合的模型,通过集成深度学习的BiLSTM方法和改进型CRF方法,实现对新闻文章的观点持有者、评价对象和观点极性3种实体信息的提取。试验表明:相较于CRF算法,准确率、召回率和F1值平均提高12.29%、10.00%和11.07%。
1
条件随机场原理.pdf
2021-08-21 09:44:28 1.97MB 机器学习
1