中文、微博、情感分析、SVM模型实现、DNN模型实现。微博评论数据集7962条,其中包含积极和消极情感倾向。主要做法如下:
实现语言:python、tensorflow==1.12、keras==2.2.4
一是基于传统文本特征表示的稀疏性,结合当前成熟技术,设计并实现了基于Word2vec的词向量训练方法,该方法可以将词表示为具有语义关系的特征向量形式,方便模型的使用。
二是采用自然语言处理常用技术完成对文本的预处理操作,既是完成了数据的预处理过程。
三是研究并实现了SVM和DNN两个最具代表性的模型在中文情感分析领的应用,完成了大数据的数据挖掘过程。并在已有的数据集上进行了实验,由具体实验结果我们发现SVM神经网络模型取得了78.03%的F值,较DNN(88%)方法低了9%,但是其训练速度较快。