爬取豆瓣电影短评并制作词云
2021-06-23 19:07:35 8.41MB 词云 豆瓣电影
1
用爬虫爬取豆瓣电影TOP250,并用PythonTkinter实现GUI展示与电影信息检索
2021-06-23 19:07:35 16KB Tkinter 检索 豆瓣电影 TOP250
豆瓣电影评论爬取+情感分析+词云 注意未登录的豆瓣账号(不填写Cookie,只能爬取200条评论,登陆后填写可以爬取500条) 运行该项目需要调整好main.py中的参数,直接运行即可
2021-06-23 19:07:33 378KB 情感分析 词云 豆瓣电影
爬取豆瓣影评、清洗、jieba分词、做词云图 本程序主要分为3个过程。 1、抓取网页数据 使用Python爬虫技术获取豆瓣电影中最新上映电影的网页,其网址如下: https://movie.douban.com/cinema/nowplaying/qingdao/ 正在上映的电影 每个电影的ID和名称 通过其HTML解析出每部电影的ID号和电影名,获取某ID号就可以得到该部电影的影评网址,形势如下: https://movie.douban.com/subject/26900949/comments https://movie.douban.com/subject/26871938/comments 其中,26900949、26871938就是电影《天使陷落》、《灭绝》的ID号,这样仅仅获取了20哥影评,可以指定开始号start来获取更多影评,例如: https://movie.douban.com/subject/26900949/comments?start=40&limit=20 这意味着获取从第40条开始得20个影评。 2、清理数据 通常将某部影评信息存入eachCommentList列表中。为便于数据清理和词频统计,把eachCommentList列表形成字符串comments,将comments字符串中的“也”“太”“ 的”等虚词(停用词)清理掉后进行词频统计。 3、用词云进行展示 最后使用词云包对影评信息进行词云展示。
2021-06-23 19:07:33 9.91MB jieba 清洗 词云图 豆瓣影评
python爬虫-爬取豆瓣评分前250的电影信息
2021-06-14 18:05:05 5KB python 爬虫
1
Python爬取豆瓣TOP250电影排行榜(小甲鱼),学习python爬虫的好资料,你值得拥有!
2021-06-13 09:41:15 61.84MB Python
1
主要介绍了python requests库爬取豆瓣电视剧数据并保存到本地详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2021-06-11 09:37:54 204KB python requests库 爬取豆瓣 保存到本地
1
# -*-coding:utf-8-*- import urllib.request from bs4 import BeautifulSoup def getHtml(url): """获取url页面""" headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.94 Safari/537.36'} req = urllib.request.Request(url,headers=heade
2021-06-02 00:42:29 253KB python 展示 词云
1
模拟谷歌浏览器爬取豆瓣电影TOP250,爬取信息包括电影详情链接、图片链接、影片中文名、影片外国名、评分、评价数、概况、相关信息等。适用于Python初学者以及Python爱好者用于练习,代码注释清晰、可读性强。若下载后代码运行出现问题,请及时与我联系。
2021-05-29 09:01:43 6KB 爬虫 豆瓣电影 python
1
用爬虫爬取豆瓣电影TOP250源代码,并存储至sqlite数据库.需要安装bs4,requests,urllib,re,openpyxl,sqlite3等库
2021-05-21 20:43:51 32KB 豆瓣TOP250 爬虫 源代码
1