搜索【爬取豆瓣】的结果

爬取豆瓣电影短评并制作词云

2021-06-23 19:07:35 8.41MB 词云 豆瓣电影

1

用爬虫爬取豆瓣电影TOP250，并用PythonTkinter实现GUI展示与电影信息检索

2021-06-23 19:07:35 16KB Tkinter 检索 豆瓣电影 TOP250

爬取豆瓣电影官网上的前200条评论并进行情感分析，并且生成词云

豆瓣电影评论爬取+情感分析+词云注意未登录的豆瓣账号(不填写Cookie，只能爬取200条评论，登陆后填写可以爬取500条) 运行该项目需要调整好main.py中的参数,直接运行即可

2021-06-23 19:07:33 378KB 情感分析 词云 豆瓣电影

爬取豆瓣影评、清洗、jieba分词、做词云图

爬取豆瓣影评、清洗、jieba分词、做词云图本程序主要分为3个过程。 1、抓取网页数据使用Python爬虫技术获取豆瓣电影中最新上映电影的网页，其网址如下： https://movie.douban.com/cinema/nowplaying/qingdao/ 正在上映的电影每个电影的ID和名称通过其HTML解析出每部电影的ID号和电影名，获取某ID号就可以得到该部电影的影评网址，形势如下： https://movie.douban.com/subject/26900949/comments https://movie.douban.com/subject/26871938/comments 其中，26900949、26871938就是电影《天使陷落》、《灭绝》的ID号，这样仅仅获取了20哥影评，可以指定开始号start来获取更多影评，例如： https://movie.douban.com/subject/26900949/comments?start=40&limit=20 这意味着获取从第40条开始得20个影评。 2、清理数据通常将某部影评信息存入eachCommentList列表中。为便于数据清理和词频统计，把eachCommentList列表形成字符串comments，将comments字符串中的“也”“太”“ 的”等虚词（停用词）清理掉后进行词频统计。 3、用词云进行展示最后使用词云包对影评信息进行词云展示。

2021-06-23 19:07:33 9.91MB jieba 清洗 词云图 豆瓣影评

python爬虫-爬取豆瓣评分前250的电影信息

2021-06-14 18:05:05 5KB python 爬虫

1

Python爬取豆瓣TOP250电影排行榜(小甲鱼)

Python爬取豆瓣TOP250电影排行榜(小甲鱼)，学习python爬虫的好资料，你值得拥有！

2021-06-13 09:41:15 61.84MB Python

1

python requests库爬取豆瓣电视剧数据并保存到本地详解

主要介绍了python requests库爬取豆瓣电视剧数据并保存到本地详解,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

2021-06-11 09:37:54 204KB python requests库 爬取豆瓣 保存到本地

1

python 爬取豆瓣电影评论，并进行词云展示

# -*-coding:utf-8-*- import urllib.request from bs4 import BeautifulSoup def getHtml(url): """获取url页面""" headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.94 Safari/537.36'} req = urllib.request.Request(url,headers=heade

2021-06-02 00:42:29 253KB python 展示词云

1

爬取豆瓣电影TOP250

模拟谷歌浏览器爬取豆瓣电影TOP250，爬取信息包括电影详情链接、图片链接、影片中文名、影片外国名、评分、评价数、概况、相关信息等。适用于Python初学者以及Python爱好者用于练习，代码注释清晰、可读性强。若下载后代码运行出现问题，请及时与我联系。

2021-05-29 09:01:43 6KB 爬虫 豆瓣电影 python

1

爬虫爬取豆瓣电影TOP250源代码

用爬虫爬取豆瓣电影TOP250源代码,并存储至sqlite数据库.需要安装bs4,requests,urllib,re,openpyxl,sqlite3等库

2021-05-21 20:43:51 32KB 豆瓣TOP250 爬虫 源代码

1

个人信息

热门下载

最新下载

其他资源