项目背景: 本文通过抓取京东某笔记本的评论数据,简单从几个维度进行分析,并制作用户评论的词云图。 爬取数据: 商品链接 通过对商品评论页面进行探索,发现评论数据是通过发送请求,然后从数据库调取此商品的评论数据,返回的评论数据是Json格式。可以点击下一页,抓到发送请求的链接: https://club.jd.com/comment/productPageComments.action?callback=fetchJSON_comment98&productId=100012443350&score=0&sortType=5&page=1&pageSize=10&isShadowSku=0&ri
2021-03-11 09:24:16 73KB 云图 分词 爬虫
1
爬取苏宁易购得到的空调商品评论,可用于数据分析学习,不得用作商业用途。
2021-02-22 10:09:39 669KB 数据挖掘 自然语言处理 LDA Tfidf
1
拼多多商品网络爬虫 抓包分析
2019-12-21 22:17:07 5KB Python 拼多多 网络爬虫
1
系列教程《手把手教你写电商爬虫》第五课,详细讲解了如何开发爬虫爬取一些有名的电商网站数据。对于学习爬虫的开发者有很大帮助,内含大量可直接运行的源码。 第五课主要以爬取京东的商品评论为例。
2019-12-21 20:35:55 621KB 电商 爬虫
1
NLPIR分词工具由中科院开发,其支持用户自定义词典。这是在做商品评论情感分析时整理的2019个自定义词汇。
2019-12-21 20:14:47 23KB 自定义词典
1
数据概览:10 个类别,共 6 万多条评论数据,正、负向评论各约 3 万条, 包括书籍、平板、手机、水果、洗发水、热水器、蒙牛、衣服、计算机、酒店
2019-12-21 20:11:47 10.78MB g'
1
中文京东商品评论数据集,分为正负两类,共4000个,可用做文本分类实验
2019-12-21 20:00:11 741KB 文本分类
1
亚马逊评论详情页是动态加载的,不过多折腾,直接用selenium进行爬取;用pandas写入csv文件,解决乱码、无序问题;
2019-12-21 19:45:13 2KB Amazon
1
LDA贝叶斯算法实现的电商行业商品评论与情感分析案例,数据集主要涉及‘美的’品牌的评论
2019-12-21 18:57:29 8.95MB 评论数据集
1