python爬取豆瓣每个账户对电影的评分和影评,绘制评分饼图和影评词云图

上传者: 31967985 | 上传时间: 2019-12-21 18:53:17 | 文件大小: 14KB | 文件类型: py
(1)打开豆瓣一部电影评论区,根据html结构捕获三个信息: 一,每账号的评分等级为5星、4星、3星、2星、1星; 二,每个账号的评论留言; 三,跳转到下个评论页面的http链接 (2)获取所有的信息后对信息进行处理: 一,计算出每个星级的总数和一共多少账户进行了评级 二、将所有的评论内容放在一起,处理评论中的空格和其他不规范形式 (3)用matplotlib绘制评分等级占比的饼图,用jieba进行分词处理,用wordcloud生成词云图 同个修改url=https://movie.douban.com/subject/26430636/comments?start=0&limit=20&sort=new_score&status=P&percent;_type= 之中“26430636”为电影的代表,将其换做其他的编号就可以读取和生成其他电影的matplotlib和wordcloud制作评分图和词云图

文件下载

评论信息

  • yue121213 :
    很不错,实用
    2019-08-21
  • sylvia_fei :
    有导读,能成功生成饼图和评论文件
    2019-06-30

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明