经多个数据集整理而成,可直接用于训练的商品好评差评数据集,含一下分类:零食,书籍,计算机,手机数码,热水器,酒店,手机,洗发水,牛奶,衣服,平板,水果,公共有6.8w条
2022-12-18 16:02:41 7.99MB 文档资料 好评 差评 数据集
1
小旋风万能蜘蛛池x9.02开心版/带教程 程序真实可用 记得评论 谢谢 全网价最低 蜘蛛池搭建/蜘蛛池下载/小旋风蜘蛛池
1
YouTube情绪分析 在此存储库中,您将找到用于对youtube视频评论,喜欢/不喜欢和观看进行探索性数据分析(EDA)的笔记本。 在jupyter笔记本中提供答案的各种分析问题都记录在“问题说明”文本文件中。 任何开始学习EDA的人都可以使用存储库中提供的数据,也可以使用笔记本作为各种分析技术及其实现的参考。 可以在以下链接上查看笔记本: : 。 只需复制此链接: : 到nbviewer网站并查看笔记本那里。
2022-12-14 16:21:51 59.04MB JupyterNotebook
1
基于机器学习的商品评论情感分析——毕业设计项目.zip从淘宝爬取评论 使用Selenium模拟真实登录行为,并爬取数据。 数据清理 如果文本中有“666“,”好好好“等无用词语,去掉评论中的标点符号。 分词 使用jieba精确模式进行分词,构造词典 将词汇向量化 创建词语字典,并返回每个词语的索引,词向量,以及每个句子所对应的词语索引 分类模型对比 SVM vs LSTM 基于机器学习的商品评论情感分析——毕业设计项目.zip从淘宝爬取评论 使用Selenium模拟真实登录行为,并爬取数据。 数据清理 如果文本中有“666“,”好好好“等无用词语,去掉评论中的标点符号。 分词 使用jieba精确模式进行分词,构造词典 将词汇向量化 创建词语字典,并返回每个词语的索引,词向量,以及每个句子所对应的词语索引 分类模型对比 SVM vs LSTM 基于机器学习的商品评论情感分析——毕业设计项目.zip从淘宝爬取评论 使用Selenium模拟真实登录行为,并爬取数据。 数据清理 如果文本中有“666“,”好好好“等无用词语,去掉评论中的标点符号。 分词 使用jieba精确
毕设新项目 基于SVM和LSTM实现的购物平台商品评论情感对比分析毕设源码+数据集+模型+项目说明.7z 【项目介绍】 使用Selenium模拟真实登录行为,并爬取数据 数据清理 将词汇向量化 使用jieba精确模式进行分词,构造词典 创建词语字典,并返回每个词语的索引,词向量,以及每个句子所对应的词语索引 分类模型对比。 【备注】主要针对正在做毕设的同学和需要项目实战的机器学习、深度学习cv图像识别模式识别方向学习者。 也可作为课程设计、期末大作业。包含:项目源码、训练好的模型、项目操作说明等,该项目可直接作为毕设使用。 也可以用来学习、参考、借鉴。如果基础不错,在此代码上做修改,训练其他模型。
2022-12-13 13:26:04 49.86MB 机器学习 LSTM SVM
乐视网评论功能升级需求
2022-12-09 15:20:16 38KB 需求文档
1
自然语言处理、 文本挖掘、 数据格式 TEXT 数据介绍 为了弥补国内在中文情感挖掘方面的语料的匮乏 谭松波 收集整理了一个较大规模的酒店评论语料。
2022-12-09 11:44:14 775KB nlp 机器学习
1
300万条评论情绪判断数据集,有1749055行具有正标签(satisfying =1), 308112行具有负标签(unsatisfying =1), 875580行没有任何标签(satisfying =0和unsatisfying =0)。 300万条评论情绪判断数据集,有1749055行具有正标签(satisfying =1), 308112行具有负标签(unsatisfying =1), 875580行没有任何标签(satisfying =0和unsatisfying =0)。 300万条评论情绪判断数据集,有1749055行具有正标签(satisfying =1), 308112行具有负标签(unsatisfying =1), 875580行没有任何标签(satisfying =0和unsatisfying =0)。
2022-12-08 11:28:23 176.49MB 数据集 评论 情绪 深度学习
自然语言处理数据集-52万件商品一千多个类目,近150 万用户,近800 万条评论评分数据
2022-12-07 10:31:53 267.27MB 商品数据集
1
基于深度学习LSTM算法的电商评论的情感分析(JD商城数据)全部资料.zip实验流程 对京东网站进行分析,并且通过分布式爬虫进行数据采集 对采集到的数据进行清洗,包括删掉重复数据,删掉垃圾数据等 对清理好的数据进行分词,停词等操作,并对结果保存到新的文档 将分词之后的数据,通过word2vec,建立词向量和索引表 对清洗后的数据,进行数据处理,将分数为1、2的定为不满意,将分数为3,4,5的定为满意 平衡正负样本数据,并且通过样本数据选出合适的文本长度值 词响亮与标签结合,生成可供训练的样本数据 建立分批(batch)函数 通过Tensorflow中的rnn模块进行lstm建模 开始训练,每1000次输出一次结果,每10000次,保存一下模型 绘制loss和accurate图像 实验总结 情感分析是一项非常重要的工作,无论是对商品满意度,电影满意度,政府满意度或者是群众情绪导向等多个领域,情感分析都是饰演着重要的角色,本实验通过大规模分布式爬虫对数据进行采集,获得到了目标数据,然后进行了数据处理,通过word2vec模型建立出了词向量和索引,在通过LSTM算法,进行了模型训练,根据最终