本代码使用python对豆瓣电影信息进行爬取,将数据转存到数据库,并对爬取的数据进行分析及可视化。
2021-07-20 11:11:00 1.34MB 豆瓣电影 python 爬虫 数据分析
豆瓣电影top_250.xlsx
2021-07-16 21:02:40 30KB 电影 娱乐 豆瓣
python项目实战——豆瓣电影小助手。里面包含需求分析、答辩记录以及项目源码。该项目主要是通过查询豆瓣上的电影排名或搜索电影名称,通过电影名称来对多个网址进行爬虫搜索免费观看链接。点击搜索到的链接即可进入观看网址免费观看电影
2021-07-15 18:03:08 9.71MB python
豆瓣电影进行爬取,对数据进行清洗、可视化 资源下载:https://blog.csdn.net/jklxx110/article/details/118701823
2021-07-13 16:04:38 34.4MB python 爬虫 可视化 豆瓣电影
1
基于Python Scrapy实现的豆瓣电影数据采集爬虫系统 含数据库SQL和全部源代码 # -*- coding: utf-8 -*- """ @Author : nesta @Email : 572645517@qq.com @Software: PyCharm @project : movie @File : MovieSpider.py @Time : 2018/4/26 9:18 """ from scrapy.spiders import Spider from scrapy.http import Request from scrapy.selector import Selector from movie.items import MovieItem class MovieSpider(Spider): name = 'movie' url = u'https://movie.douban.com/top250' start_urls = [u'https://movie.douban.com/top250'] def parse(self, response): item = MovieItem() selector = Selector(response) # 解析 movies = selector.xpath('//div[@class="info"]') for movie in movies: title = movie.xpath('div[@class="hd"]/a/span/text()').extract() fullTitle = '' for each in title: fullTitle += each movieInfo = movie.xpath('div[@class="bd"]/p/text()').extract() star = movie.xpath('div[@class="bd"]/div[@class="star"]/span[@class="rating_num"]/text()').extract()[0] quote = movie.xpath('div[@class="bd"]/p/span/text()').extract() if quote: quote = quote[0] else: quote = '' item['title'] = fullTitle item['movieInfo'] = ';'.join(movieInfo).replace(' ', '').replace('\n', '') item['star'] = star[0] item['quote'] = quote yield item nextPage = selector.xpath('//span[@class="next"]/link/@href').extract() if nextPage: nextPage = nextPage[0] print(self.url + str(nextPage)) yield Request(self.url + str(nextPage), callback=self.parse)
2021-07-10 17:02:46 14KB python scrapy 豆瓣电影 数据爬虫
Scrapy 爬虫 + 数据清理 + 数据分析 + 构建情感分析模型 一、爬取豆瓣Top250的短评数据 movie_item movie_comment movie_people 二、数据清理与特征工程+统计分析 movie_item 总评分最高的前10部电影 最受欢迎的电影类别排名 最受欢迎的电影出品国家排名 最受欢迎的电影导演排名 最受欢迎的电影演员排名 最受欢迎的电影语言排名 根据电影时长的电影排名 根据电影投票数的电影排名 根据电影评价数的电影排名 根据电影提问数的电影排名 根据电影发布时间的规律 1~5星级投票的百分比 电影简介的情感分析 movie_comment 就肖申克的救赎这个电影而言 短评词云 用朴素贝叶斯完成中文文本分类器 用svc完成中文文本分类器 用facebook-fasttext有监督完成中文文本分类 用facebook-fasttext无监督学习 用cnn做中文文本分类 用rnn做中文文本分类 用gru来完成中文文本分类 全部影片的短评数据分析 movie_people 短评人常居地按照国家分布 中国短评人常居地按照省份分布 每个短评人的被关注数与好友数 中国短评人的被关注数和好友数的人均地域分布 根据点评人个人简介构建中文文本分类模型 三、movie_item + movie_comment + movie_people 三个数据集间的协同分析 通过短评来预测被评价电影是什么类型 小结
2021-07-08 15:02:44 73.43MB TOP250 豆瓣电影短评 Scrapy
电影上映热映豆瓣电影简介小程序.zip
2021-06-30 18:06:37 3.69MB 小程序
基于社交网络的电影票房分析--以豆瓣电影和新浪微博为例,郑玲,李昕,近年来随着互联网技术飞快进步,社交网络媒体层出不穷,移动互联网的到来,使得人们参与网络社交更加便利,越来越多的研究人员开
2021-06-26 14:57:56 599KB 计算机软件
1
在这个豆瓣电影分析与推荐系统中,我们使用了PYTHON语言来编写整个项目代码,分析所需数据完全利用爬虫爬取得到,爬取所得的数据被存入MYSQL数据库中,取得的数据被用作两个方面。 其一,被爬取得到的数据被用于进行电影分析,我们将爬取到的top300部电影的信息按照影片发行国家和影片类型进行了分析并制作了图表来直观显示受欢迎的电影的分类。 其二,我们利用了一种用于推荐系统的算法---协同过滤算法,来为每位参与电影评分的用户筛选出推荐电影内容,首先读入数据,形成用户-电影矩阵,其次根据用户-电影矩阵计算不同电影之间的相关系数(一般用person相关系数),形成电影-电影相关度矩阵。然后根据电影-电影相关度矩阵,以及用户已有的评分,通过加权平均计算用户未评分电影的预估评分。例如用户对A电影评3分、B电影评4分、C电影未评分,而C电影与A电影、B电影的相关度分别为0.3和0.8,则C电影的预估评分为(0.3*3+0.8*4)/(0.3+0.8)。 然后,我们实现了一些创新的功能。首先,我们爬取网页当中电影的数据,对网页当中的电影数据进行分析,分类,确定不同类型电影的百分比。然后我们分析用户对不同类型电影的打分情况,运用同类分析的方法对用户进行推荐其可能感兴趣的电影
2021-06-26 13:08:49 591KB 豆瓣电影 数据分析 推荐系统
50个微信小程序源码: AppleMusic B站首页界面设计:附详细教程 cnode社区版 dribbble FlexLayout布局 gank HIapp IT-EBOOK leantodu LOL战绩查询 movecss效果 Railay:整体框架 redux绑定 TCP,IP长连接 todo list v2ex 东航订机票 二维码生成器 仿微信DEMO 仿找事吧 仿网易云音乐 会议精灵 侧滑布局 分答小程序 创客+实现大量功能,推荐研究 剪刀石头布 城市切换 备忘录 大转盘 家居电商 富文本解析,折线图,MD5,bluebird 机器人兔兔 极客学院 果库 查拼音 步步高字典 滑动选项卡 滴滴公交-查公交 电商-拼团 倒计时 电商小程序 电影推荐 电影日历 画布:时钟 番茄时钟 百度小说 简易计算器 豆瓣图书 豆瓣电影 货币汇率 购物车 车源宝 辩论倒计时 高仿苹果计算器