【计算机课程设计】python 豆瓣(爬取+可视化),使用前请查看说明文档
2022-10-31 17:43:02 4.95MB Python
1
前段时间奉俊昊的《寄生虫》在奥斯卡上获得不少奖项,我也比较喜欢看电影,看过这部电影后比较好奇其他人对这部电影的看法,于是先用R爬取了部分豆瓣影评,jieba分词后做了词云了解,但是如果不登录豆瓣直接爬取影评只可以获得十页短评,这个数据量我认为有点少,于是整理了python模拟登录豆瓣,批量爬取数据,制作特别样式词云的方法。 一、 用到的Python库 import os ##提供访问操作系统服务的功能 import re ##正则表达式 import time ##处理时间的标准库 import random ##使用随机数标准库 import requests ##实现登录 import n
2021-12-22 08:27:28 847KB jieba python 豆瓣
1
用于数据分析,可视化
2021-11-30 09:04:10 297KB 数据挖掘 数据分析
1
2万3千多条数据,包括: 全球唯一图书编号; 书名; 作者; 作者简介; 标签;评分人数; 评分; 豆瓣内该书Id; 精装/简装; 页数; 出版商; 图书原名 豆瓣链接; 图书豆瓣图片; 图书概述;
2019-12-21 21:04:27 8.64MB 豆瓣图书 图书信息
1
豆瓣电影名称类别评分时长评论年份爬取主函数
2019-12-21 20:20:50 14KB 豆瓣爬取
1