上传者: 38722052
|
上传时间: 2021-11-28 01:51:05
|
文件大小: 789KB
|
文件类型: -
刚接触python不久,做一个小项目来练练手。前几天看了《战狼2》,发现它在最新上映的电影里面是排行第一的,如下图所示。准备把豆瓣上对它的影评做一个分析。
目标总览
主要做了三件事:
抓取网页数据
清理数据
用词云进行展示
使用的python版本是3.5.
一、抓取网页数据
第一步要对网页进行访问,python中使用的是urllib库。代码如下:
from urllib import request
resp = request.urlopen('https://movie.douban.com/nowplaying/hangzhou/')
html_data = resp.re