Scrapy 爬虫 + 数据清理 + 数据分析 + 构建情感分析模型 一、爬取豆瓣Top250的短评数据 movie_item movie_comment movie_people 二、数据清理与特征工程+统计分析 movie_item 总评分最高的前10部电影 最受欢迎的电影类别排名 最受欢迎的电影出品国家排名 最受欢迎的电影导演排名 最受欢迎的电影演员排名 最受欢迎的电影语言排名 根据电影时长的电影排名 根据电影投票数的电影排名 根据电影评价数的电影排名 根据电影提问数的电影排名 根据电影发布时间的规律 1~5星级投票的百分比 电影简介的情感分析 movie_comment 就肖申克的救赎这个电影而言 短评词云 用朴素贝叶斯完成中文文本分类器 用svc完成中文文本分类器 用facebook-fasttext有监督完成中文文本分类 用facebook-fasttext无监督学习 用cnn做中文文本分类 用rnn做中文文本分类 用gru来完成中文文本分类 全部影片的短评数据分析 movie_people 短评人常居地按照国家分布 中国短评人常居地按照省份分布 每个短评人的被关注数与好友数 中国短评人的被关注数和好友数的人均地域分布 根据点评人个人简介构建中文文本分类模型 三、movie_item + movie_comment + movie_people 三个数据集间的协同分析 通过短评来预测被评价电影是什么类型 小结
2021-07-08 15:02:44 73.43MB TOP250 豆瓣电影短评 Scrapy
Python爬取豆瓣top250电影数据,并导入MySQL,写入excel 具体数据:电影链接、电影名称、电影评分、评分人数、电影概括 import pymysql import xlwt from bs4 import BeautifulSoup from urllib import request import re baseurl = 'https://movie.douban.com/top250?start='\nheaders = {\n 'User-Agent': 'XXXXX', 'Referer': 'https://movie.douban.com/top250?
2021-07-06 12:57:58 35KB c ce ex
1
5分钟使用Python爬取豆瓣TOP250电影榜
2021-07-04 17:03:32 55KB 豆瓣 TOP250
1
数据分析与挖掘案例之使用python抓取豆瓣top250电影数据进行分析-附件资源
2021-06-24 13:28:56 106B
1
python爬虫项目初学,豆瓣top250电影小说数据分析 pyhton3+urllib+flask+echars+worldcloud+sqlite3
2021-06-23 19:07:36 59.93MB flask worldcloud top250 python
用爬虫爬取豆瓣电影TOP250,并用PythonTkinter实现GUI展示与电影信息检索
2021-06-23 19:07:35 16KB Tkinter 检索 豆瓣电影 TOP250
豆瓣电影TOP250 基于MVVM架构,采用kotiln进行开发的豆瓣电影TOP250 Android App 应用截图 下载 点击下载 说明 初次使用kotlin进行开发,欢迎交流探讨 Email: zlogo913@gmail.com
2021-06-21 16:27:21 2.8MB Android代码
1
使用Python爬取的豆瓣电影top250生成的excel 与 数据库文件方便后期进行数据分析和可视化处理
2021-06-16 19:37:13 45KB 豆瓣电影top250
1
Python爬取豆瓣TOP250电影排行榜(小甲鱼),学习python爬虫的好资料,你值得拥有!
2021-06-13 09:41:15 61.84MB Python
1
批量下载豆瓣电影TOP250(测试可以爬) 资源环境 python3 模块支持 bs4 requests pymysql mysql本地数据库/远程也可
2021-05-30 14:45:05 2KB 豆瓣电影 TOP250 python3 爬虫
1