豆瓣电影评论爬取+情感分析+词云 注意未登录的豆瓣账号(不填写Cookie,只能爬取200条评论,登陆后填写可以爬取500条) 运行该项目需要调整好main.py中的参数,直接运行即可
2021-06-23 19:07:33 378KB 情感分析 词云 豆瓣电影
爬取豆瓣影评、清洗、jieba分词、做词云图 本程序主要分为3个过程。 1、抓取网页数据 使用Python爬虫技术获取豆瓣电影中最新上映电影的网页,其网址如下: https://movie.douban.com/cinema/nowplaying/qingdao/ 正在上映的电影 每个电影的ID和名称 通过其HTML解析出每部电影的ID号和电影名,获取某ID号就可以得到该部电影的影评网址,形势如下: https://movie.douban.com/subject/26900949/comments https://movie.douban.com/subject/26871938/comments 其中,26900949、26871938就是电影《天使陷落》、《灭绝》的ID号,这样仅仅获取了20哥影评,可以指定开始号start来获取更多影评,例如: https://movie.douban.com/subject/26900949/comments?start=40&limit=20 这意味着获取从第40条开始得20个影评。 2、清理数据 通常将某部影评信息存入eachCommentList列表中。为便于数据清理和词频统计,把eachCommentList列表形成字符串comments,将comments字符串中的“也”“太”“ 的”等虚词(停用词)清理掉后进行词频统计。 3、用词云进行展示 最后使用词云包对影评信息进行词云展示。
2021-06-23 19:07:33 9.91MB jieba 清洗 词云图 豆瓣影评
主要技术:httpclient模拟浏览器发送请求;异步加载图片资源,采用软引用将图片资源缓存在内存中;获取的数据量大的情况下采用分批加载数据;优化用户体验,在3G情况下不加载图片;保证程序不异常终止,并将错误信息发送给服务器端;用到了MVC设计模式。
2021-06-23 08:34:02 3.16MB android 读书软件
1
本数据资源来源于豆瓣电影数据的爬虫所得,共有数据2458条,作为本博客栏目下的python数据实战分析中国产烂片深度解析的数据来源
2021-06-22 15:32:26 850KB 数据分析 国产烂片 python 豆瓣电影
1
豆瓣电影TOP250 基于MVVM架构,采用kotiln进行开发的豆瓣电影TOP250 Android App 应用截图 下载 点击下载 说明 初次使用kotlin进行开发,欢迎交流探讨 Email: zlogo913@gmail.com
2021-06-21 16:27:21 2.8MB Android代码
1
一个简单的仿豆瓣的微信小程序项目
2021-06-19 19:36:11 336KB JavaScript开发-微信小程序
1
爬取豆瓣租房小组中发布的租房信息
2021-06-17 18:05:26 7KB 爬虫 scrapy 租房
使用Python爬取的豆瓣电影top250生成的excel 与 数据库文件方便后期进行数据分析和可视化处理
2021-06-16 19:37:13 45KB 豆瓣电影top250
1
一、概要      在学习了python爬虫(requests,bs4)以及numpy、pandas、matplotlib库之后,就想试个小项目磨磨刀。之前只会单方面的使用,比如爬取一个网站相关数据 或者 对已经给了的数据进行分析。这个项目将这几个部分串起来了。学过这几个库的人就知道,这个项目很简单嘛。确实不难,但是自己完整的做完还是会出很多意想不到的bug。另:如果有同学只想做数据分析和可视化展示,这也没问题。以下百度网盘链接也提供了已经使用爬虫获取的数据。     环境:python(anaconda)     源码:百度网盘链接:https://pan.baidu.com/s/101ck
2021-06-16 15:36:13 710KB python python爬虫 人生
1
微信小程序实现简单的豆瓣电影,可以再首页查看豆瓣排名钱250的电影并且点击跳转到详情页,搜索页可输入关键字搜索相关电影。
2021-06-16 11:05:19 24KB 微信小程序
1