微博立场检测是判断一段微博文本针对某一目标话题所表达的观点态度是支持、中立或反对.随着社交媒体的发展,从海量的微博数据中挖掘其蕴含的立场信息成为一项重要的研究课题.但是现有的方法往往将其视作情感分类任务,没有对目标话题和微博文本之间的关系特征进行分析,在基于深度学习的分类框架上,扩展并提出了基于Bert-Condition-CNN的立场检测模型,首先为提高话题在文本中的覆盖率,对微博文本进行了主题短语的提取构成话题集;然后使用Bert预训练模型获取文本的句向量,并通过构建话题集和微博文本句向量之间的关系矩阵Condition层来体现两个文本序列的关系特征;最后使用CNN对Condition层进行特征提取,分析不同话题对立场信息的影响并实现对立场标签的预测.该模型在自然语言处理与中文计算会议(NLPCC2016)的数据集中取得了较好的效果,通过主题短语扩展后的Condition层有效地提升了立场检测的准确度.
2021-12-25 21:20:30 1.37MB 立场检测 主题短语 关系矩阵 句向量
1
常见的文本特征(句向量)提取方法.pdf
2021-11-22 09:08:46 276KB NLP 文本特征提取
1
中文问句分类数据集,可用于训练中文问句分类和句向量抽取等任务。
1
一行代码使用BERT生成句向量,BERT做文本分类、文本相似度计算
2021-06-03 21:39:07 2.97MB BERT
1
闲聊机器人(chatbot),BERT句向量-相似度(Sentence Similarity),文本分类(Text classify) 数据增强(text augment enhance),同义句同义词生成,句子主干提取(mainpart),中文汉语短文本相似度,文本特征工程,keras-http-service调用
2021-05-14 22:47:34 2.15MB Python开发-自然语言处理
1
本文基于Google开源的BERT代码进行了进一步的简化,方便生成句向量与做文本分类
2019-12-21 21:40:14 2.96MB Python开发-自然语言处理
1