kaggle5000部电影数据下载
2021-07-09 09:11:17 8.89MB kaggle 5000电影数据
1
国庆档期电影数据点评:主旋律影片引爆国庆观影热潮,关注行业票房回暖.pdf
Python爬取豆瓣top250电影数据,并导入MySQL,写入excel 具体数据:电影链接、电影名称、电影评分、评分人数、电影概括 import pymysql import xlwt from bs4 import BeautifulSoup from urllib import request import re baseurl = 'https://movie.douban.com/top250?start='\nheaders = {\n 'User-Agent': 'XXXXX', 'Referer': 'https://movie.douban.com/top250?
2021-07-06 12:57:58 35KB c ce ex
1
数据包括IMDB网站上抓取的5043部电影28个属性信息,4906张海报,电影时间跨度超过100年和66个国家,并包括2399位导演和数千位演员。属性包括:电影名称、评论数、评分、导演、上映时间、上映国家、主要演员、语言、IMDB评分等。
2021-07-02 15:03:55 580KB 电影数据 电影信息 Kaggle
1
我们将在MovieLens(http://movielens.org)数据集上进行实验,在实验中,我们主要利用到的数据集中的两个文件u.data和u.item,其中u.item中记录的是电影的相关信息,u.data中主要是用户对电影的评分信息,评分的范围是1-5,文件的每一列分别表示用户ID,电影ID,评分,时间戳。
2021-06-30 13:43:36 152KB 电影数据 协同过滤数据
1
爬取豆瓣热门电影数据,并存储到本地MySql数据库
2021-06-29 18:06:58 22KB Python开发-Web爬虫
1
在这个豆瓣电影分析与推荐系统中,我们使用了PYTHON语言来编写整个项目代码,分析所需数据完全利用爬虫爬取得到,爬取所得的数据被存入MYSQL数据库中,取得的数据被用作两个方面。 其一,被爬取得到的数据被用于进行电影分析,我们将爬取到的top300部电影的信息按照影片发行国家和影片类型进行了分析并制作了图表来直观显示受欢迎的电影的分类。 其二,我们利用了一种用于推荐系统的算法---协同过滤算法,来为每位参与电影评分的用户筛选出推荐电影内容,首先读入数据,形成用户-电影矩阵,其次根据用户-电影矩阵计算不同电影之间的相关系数(一般用person相关系数),形成电影-电影相关度矩阵。然后根据电影-电影相关度矩阵,以及用户已有的评分,通过加权平均计算用户未评分电影的预估评分。例如用户对A电影评3分、B电影评4分、C电影未评分,而C电影与A电影、B电影的相关度分别为0.3和0.8,则C电影的预估评分为(0.3*3+0.8*4)/(0.3+0.8)。 然后,我们实现了一些创新的功能。首先,我们爬取网页当中电影的数据,对网页当中的电影数据进行分析,分类,确定不同类型电影的百分比。然后我们分析用户对不同类型电影的打分情况,运用同类分析的方法对用户进行推荐其可能感兴趣的电影
2021-06-26 13:08:49 591KB 豆瓣电影 数据分析 推荐系统
豆瓣电影推荐系统——通过爬取电影数据和用户数据,再利用所爬取的数据设计并实现相关推荐算法对用户进行电影推荐。然后设计出图形用户界面(GUI)进行交互,封装成电影推荐软件,针对数据集中的用户推荐相关电影。 **主要分为三大模块:** :one: 爬虫模块:request 库、json 库、MySQL :two: 推荐系统模块:基于物品的协同过滤算法(ItemCF 算法) :three: GUI 模块:PyQt5 **开发环境:Python 3.7.7**
2021-06-24 16:03:04 123.23MB Python request 爬虫 电影推荐
数据分析与挖掘案例之使用python抓取豆瓣top250电影数据进行分析-附件资源
2021-06-24 13:28:56 106B
1
基于python的数据可视化分析,使用了pandas,numpy,matplotlib,pyecharts四个库,附带课程设计源码。
1