基于深度学习LSTM算法的电商评论的情感分析(JD商城数据)全部资料.zip实验流程 对京东网站进行分析,并且通过分布式爬虫进行数据采集 对采集到的数据进行清洗,包括删掉重复数据,删掉垃圾数据等 对清理好的数据进行分词,停词等操作,并对结果保存到新的文档 将分词之后的数据,通过word2vec,建立词向量和索引表 对清洗后的数据,进行数据处理,将分数为1、2的定为不满意,将分数为3,4,5的定为满意 平衡正负样本数据,并且通过样本数据选出合适的文本长度值 词响亮与标签结合,生成可供训练的样本数据 建立分批(batch)函数 通过Tensorflow中的rnn模块进行lstm建模 开始训练,每1000次输出一次结果,每10000次,保存一下模型 绘制loss和accurate图像 实验总结 情感分析是一项非常重要的工作,无论是对商品满意度,电影满意度,政府满意度或者是群众情绪导向等多个领域,情感分析都是饰演着重要的角色,本实验通过大规模分布式爬虫对数据进行采集,获得到了目标数据,然后进行了数据处理,通过word2vec模型建立出了词向量和索引,在通过LSTM算法,进行了模型训练,根据最终
基于情感分析的汽车推荐系统的设计与实现.docx基于情感分析的汽车推荐系统的设计与实现.docx基于情感分析的汽车推荐系统的设计与实现.docx基于情感分析的汽车推荐系统的设计与实现.docx基于情感分析的汽车推荐系统的设计与实现.docx基于情感分析的汽车推荐系统的设计与实现.docx基于情感分析的汽车推荐系统的设计与实现.docx基于情感分析的汽车推荐系统的设计与实现.docx
2022-11-29 09:56:11 8KB 文档资料 汽车
摘要:本文采用酒店评论数据集进行情感分析,通过机器学习和基于情感词典两种方法进行分析比较。其中,机器学习方法采用了多种算法,有支持向量机、神经网络、朴素贝叶斯以
2022-11-29 00:09:24 1.33MB
1
sentiment analysis dataset of financial news
2022-11-16 17:36:35 37.91MB 情感分析 文本分类 新闻
1
Bigdata-movie 本项目以电影数据为主题,以数据采集、处理、分析及数据可视化为项目流程,可实现百万级电影数据离线处理与计算。 项目详解:. 开发环境:IDEA+Pycharm+Python3+hadoop2.8+hive2.3.0+mysql5.7+sqoop+spark 1.数据采集(pachong.py)、预处理: 采集豆瓣电影top250电影信息,采集电影名称、电影简介、电影评分、其他信息、电影连接等字段,抓取电影票房总收入排名情况(取前20),删除冗余和空值字,利用Python的PyMysql库连接本地Mysql数据库并导入movies表,可以将数据保存到本地,从而进行数据可视化展示,也可将数据导入到大数据的Hive数仓工具中,用于大数据分析。 采集数据展示: 排序 影片名称 类型 总票房(万) 场均人次 上映日期 1 战狼2 动作 567928 38 2017/7/27
2022-11-05 15:29:48 7.13MB Python
1
包含BosonNLP、清华大学李军中文褒贬义词、台湾大学NTUSD简体中文情感词典、知网的情感分析词典
2022-11-02 10:04:54 1.04MB nlp
1
针对传统基于人工遴选传统情感数据分析技术具有样本容量小、人为误差大、操作成本高及时效准确性难以保证的缺点,文中提出了一种基于网络数据挖掘和BP神经网络分类的情感数据分析系统。基于相应的数据处理技术,系统在机器人操作系统(ROS)上使用Kinect深度相机,完成了被检测对象心理数据的采集及预警。与传统人工参与的心理预警方式相比,该系统基于数据挖掘和智能计算技术,具有较高的准确性、实时性及自动化程度。
1