对于电影《白蛇传·情》的豆瓣短评数据,进行分词、词频统计,并绘制好评与中差评的韦恩词云图,可以清楚地分析好评与中差评间的异同。文件包括:词云图背景、.ipynb代码、豆瓣短评csv文件、结果文件。
2023-01-12 16:18:19 5.89MB 词云图 文本分析 韦恩图
1
分析并写下爬取过程 1.打开豆瓣影评url=https://movie.douban.com/review/best/ 分析页面发现一页有十部电影,循环获取这十部电影的url 2.打开其中一部电影url发现其所有短评皆在此页面的一个子url中,获取此url 3.进入短评页面获取数据,并存储 代码步骤实现 我这里用的是定义一个类来实现首先声明__init__ class DouBanSpider(object): driver_path = r"C:\Downloads\driver\chromedriver.exe"#谷歌自动测试机器人的存储路径 def __init__(se
2022-04-08 21:34:27 120KB go god le
1
python实现豆瓣短评的爬虫程序,并经过数据预处理和JieBa分词,统计词频,最终生成次云.zip
2021-12-08 16:02:50 8.12MB python 爬虫
用python爬取了豆瓣上33部关于病毒、疾病题材电影的短评,并尝试了下词频统计、可视化、词云
2021-09-01 14:05:15 7.84MB 爬虫 python 可视化 词云
1
根据电影名称爬取所有对应影评。根据电影名称爬取所有对应影评
2021-08-16 08:30:07 6.25MB 豆瓣 短评 爬虫
1
Scrapy 爬虫 + 数据清理 + 数据分析 + 构建情感分析模型 一、爬取豆瓣Top250的短评数据 movie_item movie_comment movie_people 二、数据清理与特征工程+统计分析 movie_item 总评分最高的前10部电影 最受欢迎的电影类别排名 最受欢迎的电影出品国家排名 最受欢迎的电影导演排名 最受欢迎的电影演员排名 最受欢迎的电影语言排名 根据电影时长的电影排名 根据电影投票数的电影排名 根据电影评价数的电影排名 根据电影提问数的电影排名 根据电影发布时间的规律 1~5星级投票的百分比 电影简介的情感分析 movie_comment 就肖申克的救赎这个电影而言 短评词云 用朴素贝叶斯完成中文文本分类器 用svc完成中文文本分类器 用facebook-fasttext有监督完成中文文本分类 用facebook-fasttext无监督学习 用cnn做中文文本分类 用rnn做中文文本分类 用gru来完成中文文本分类 全部影片的短评数据分析 movie_people 短评人常居地按照国家分布 中国短评人常居地按照省份分布 每个短评人的被关注数与好友数 中国短评人的被关注数和好友数的人均地域分布 根据点评人个人简介构建中文文本分类模型 三、movie_item + movie_comment + movie_people 三个数据集间的协同分析 通过短评来预测被评价电影是什么类型 小结
2021-07-08 15:02:44 73.43MB TOP250 豆瓣电影短评 Scrapy
豆瓣疯狂动物城17万短评语料库
2021-07-06 11:22:14 21.63MB 豆瓣 疯狂动物城 短评
1
疯狂动物城电影 短评,用于电影分析,下载后里面有python代码用来爬取网页数据的代码
2021-07-06 10:31:52 2KB 数据
1
自己写的一个简易用户版,给剧名即可得到想要的豆瓣信息。内含详细的操作视频教程。
2021-07-04 10:36:37 8.62MB 豆瓣爬虫
1
爬取豆瓣电影短评并制作词云
2021-06-23 19:07:35 8.41MB 词云 豆瓣电影
1