中文、微博、情感分析、SVM模型实现、DNN模型实现。微博评论数据集7962条,其中包含积极和消极情感倾向。主要做法如下: 实现语言:python、tensorflow==1.12、keras==2.2.4 一是基于传统文本特征表示的稀疏性,结合当前成熟技术,设计并实现了基于Word2vec的词向量训练方法,该方法可以将词表示为具有语义关系的特征向量形式,方便模型的使用。 二是采用自然语言处理常用技术完成对文本的预处理操作,既是完成了数据的预处理过程。 三是研究并实现了SVM和DNN两个最具代表性的模型在中文情感分析领的应用,完成了大数据的数据挖掘过程。并在已有的数据集上进行了实验,由具体实验结果我们发现SVM神经网络模型取得了78.03%的F值,较DNN(88%)方法低了9%,但是其训练速度较快。
微博情感分析和爬虫 微博是中国最具影响力的社交网站之一,拥有大量的中国用户。 它的功能类似于Twitter,当我爬网时,我什至发现微博程序员也使用了Twitter的一些变量名。 因此,如果您不懂中文,则可以查看此存储库的模型设计,而无需检查已爬网的内容(推文,推文主题等) 。 进行情感分析可以将用户分类为各种类别,并将相应的广告推送给他们。 我选择进行的情绪分析是将用户分为真实用户和机器人。 根据有关微博机器人检测的大多数论文,他们使用的方法是通过对用户的各种指标(关注度,粉丝数,平均推文时间等)进行逻辑回归对用户进行分类。 我认为这种方法的准确性不高,并且对于不同的测试集不稳定。 此类任务需要NLP模型的帮助,因为bot和真实人之间的最大区别是他们编写推文的行为和习惯。 请看一下这些colab笔记本: 以及 模型输入输出的结构 Input │── User information me
2021-12-11 15:23:39 59KB
1
基于神经语言模型的词向量表示技术能够从大规模的未标注文本数据集中自动学习词语的有效特征表 示,已经在许多自然语言处理任务及研究中取得重要进展.微博中的表情符号是微博情感分析最重要的特征之一, 已有大量的研究工作在探索有效地利用表情符号来提升微博情感分类效果.借助词向量表示技术,为常用表情符 号构建情感空间的特征表示矩阵RE;基于向量的语义合成计算原理,通过矩阵RE 与词向量的乘积运算完成词义 到情感空间的映射;接着输入到一个MCNN(Multi-channel Convolution Neural Network)模型,学习一个微博的情 感分类器.整个模型称为EMCNN(Emotion-semantics enhanced MCNN),将基于表情符号的情感空间映射与深度 学习模型MCNN结合,有效增强了MCNN捕捉情感语义的能力.EMCNN模型在NLPCC微博情感评测数据集上 的多个情感分类实验中取得最佳分类性能,并在所有性能指标上超过目前已知文献中的最好分类效果.在取得以 上分类性能提升的同时,EMCNN相对MCNN的训练耗时在主客观分类时减少了36.15%,在情感7分类时减少 了33.82%.
2021-12-08 18:02:07 1.26MB 微博 情感分析 深度学习
1
中文 八分类 贝叶斯 训练文件为ysr.py 可以生成两个模型并保存 测试文件为test.ipynb 偷个懒在notebook上写的 代码很好懂,写的也很简单,随便拿去改~
2021-12-07 21:24:57 1.89MB python 附件源码 文章源码
1
本资源为自己人工标记的微博语料,分为消极pos.txt,积极neg.txt 各60000条,适用于机器学习情感分析,训练数据原数据
2021-12-05 17:43:39 8.39MB 情感分析 微博语料 机器学习 标记语料
1
微博情感分析旨在研究用户关于热点事件的情感观点,研究表明深度学习在微博情感分析上具有可行性。针对传统卷积神经网络进行微博情感分析时忽略了非连续词之间的相关性,为此将注意力机制应用到卷积神经网络(CNN)模型的输入端以改善此问题。由于中文微博属于短文本范畴,卷积神经网络前向传播过程中池化层特征选择存在丢失过多语义特征的可能性,为此在卷积神经网络的输出端融入树型的长短期记忆神经网络(LSTM),通过添加句子结构特征加强深层语义学习。在两种改进基础上构造出一种微博情感分析模型(Att-CTL),实验表明该模型在微博情感分析上具有优良的特性,尤其在极性转移方面仍保持较高的F1值。
1
毕业设计 计算机 源码 基于AdaBoost算法的情感分析研究 此项目为本科毕业设计项目,目前已经没有时间更新了,文章、代码都有很多错误,大家借鉴一下思路就好,不要仔细研究 大学时没有好好学算法,毕竟那些树、图实在提不起兴趣,好在毕业设计选择了个机器学习算法,整了个还算是有点意思的项目,至少弥补了大学的一点点的遗憾。现在将项目开源出来,虽然感觉还是写得没有达到自己的预期,大部分也是参考别人的,有兴趣的可以下载看看吧。如果可以,希望能给个star或者fork奖励奖励 文本分类基本流程 运行环境 [anaconda: 3.5+] 本文项目流程 一、 使用微博应用获取微博文本,代码地址 二、 SVM初步分类(svm_temp.py) 三、 利用贝叶斯定理进行情感分析 四、 利用AdaBoost加强分类器 完整文档可以看doc 一、获取微博文本 二、SVM初步分类 三、使用朴素贝叶斯分类 四、AdaBoost 4.1 二分类AdaBoost 4.2 多分类AdaBoost 4.2.1 AdaBoost.SAMME 4.2.2 AdaBoost.SAMME.R
2021-11-22 20:06:27 6.39MB 系统开源
1
SinaWeibo-Emotion-Classification, 新浪微博情感分析应用
2021-11-19 13:32:23 14.32MB 开源
1
微博情感分析语料集,适用于做NLP情感分析
2021-09-28 17:08:43 2.46MB 微博情感分析语料集 情感分析
说明:数据来自腾讯微博 1。评测数据全集包括 20 个话题,每个话题采集大约1000条微博,共约20000条微博。数据采用xml格式,已经预先切分好句子。每条句子的所有标注信息都包含在元素的属性中。其中opinionated表示是否观点句,polarity表示句子情感倾向。
2021-07-25 15:47:27 68B NLP
1