基于深度学习LSTM算法的电商评论的情感分析(JD商城数据)全部资料.zip实验流程
对京东网站进行分析,并且通过分布式爬虫进行数据采集
对采集到的数据进行清洗,包括删掉重复数据,删掉垃圾数据等
对清理好的数据进行分词,停词等操作,并对结果保存到新的文档
将分词之后的数据,通过word2vec,建立词向量和索引表
对清洗后的数据,进行数据处理,将分数为1、2的定为不满意,将分数为3,4,5的定为满意
平衡正负样本数据,并且通过样本数据选出合适的文本长度值
词响亮与标签结合,生成可供训练的样本数据
建立分批(batch)函数
通过Tensorflow中的rnn模块进行lstm建模
开始训练,每1000次输出一次结果,每10000次,保存一下模型
绘制loss和accurate图像
实验总结
情感分析是一项非常重要的工作,无论是对商品满意度,电影满意度,政府满意度或者是群众情绪导向等多个领域,情感分析都是饰演着重要的角色,本实验通过大规模分布式爬虫对数据进行采集,获得到了目标数据,然后进行了数据处理,通过word2vec模型建立出了词向量和索引,在通过LSTM算法,进行了模型训练,根据最终