123639条数据,已去重,包含.csv 和 .sql 两个数据文件 包含: 电影id 评分 参与评分的人数 电影名 初始电影名 电影别名 电影时长 指出年份 首播时间 电影海报url 电影语言 制片国家地区 编剧的人数 这部电影中编剧的id列表 电影主演人数 这部电影主演id列表 这部电影导演的人数 这部电影导演id列表 电影标签 电影类型 编剧列表 主演列表 导演列表
2021-08-11 18:58:56 24.24MB 豆瓣 电影 数据分析 .csv
1
【基于R语言的数据挖掘数据分析实操案例】 【2000到2015年豆瓣共47000部电影数据分析】 第一章 数据抓取 第二章 整理电影属性 第三章 整理电影属性 第四章 这样的图表才专业 第五章 频率密度图学会ggplot2 配件 第六章大数据:谁是演艺圈的“关系户“ 第七章 社交网络数据挖掘
前面作者讲解了很多知识图谱相关的原理知识,包括知识图谱相关技术、Neo4j绘制关系图谱等,但还是缺少一个系统全面的实例。为了加深自己对知识图谱构建的认识,为后续创建贵州旅游知识图谱打下基础,作者学习了张宏伦老师的网易云课程(星球系列电影),强烈推荐大家去学习,并结合自己的理解和技术分享了该系列专栏,从数据采集、数据分析到知识图谱构建,文章后续会讲解中文数据的实体识别、关系抽取、知识展示等。 --------------------- 作者:Eastmount 来源:CSDN 原文:https://blog.csdn.net/eastmount/article/details/86714051
2021-08-05 22:03:42 20KB Python 网络爬虫 星球大战 电影数据
1
近30000条豆瓣电影信息,包括中文名,国别,类别,部分短评等信息。最关键的是有手工筛选过的关键词(类似于标签,但比标签更多)信息。
2021-07-21 15:41:28 12.08MB 豆瓣 电影 数据 关键词
1
tmdb数据电影分析与预测
2021-07-19 15:07:43 9.05MB 数据分析
1
来自运筹帷幄的豆瓣电影数据集,这个数据集可以让观影者对现有的华语电影进行分析。可以从各个维度对电影分析。
2021-07-13 10:39:29 4.22MB 豆瓣数据集
1
数据分析Nanodegree / TMBD-Movies 从Kaggle下载的TMDB电影数据集,用于数据分析。 它包含约10000部电影及其评级和基本信息。
2021-07-13 09:57:12 218KB HTML
1
These files contain 1,000,209 anonymous ratings of approximately 3,900 movies made by 6,040 MovieLens users who joined MovieLens in 2000.
2021-07-12 17:18:47 5.64MB 电影数据集
1
先爬虫得到电影目录和票房,在建模进行预测电影票房
2021-07-12 15:07:47 4.29MB 爬虫 数据分析
1
基于Python Scrapy实现的豆瓣电影数据采集爬虫系统 含数据库SQL和全部源代码 # -*- coding: utf-8 -*- """ @Author : nesta @Email : 572645517@qq.com @Software: PyCharm @project : movie @File : MovieSpider.py @Time : 2018/4/26 9:18 """ from scrapy.spiders import Spider from scrapy.http import Request from scrapy.selector import Selector from movie.items import MovieItem class MovieSpider(Spider): name = 'movie' url = u'https://movie.douban.com/top250' start_urls = [u'https://movie.douban.com/top250'] def parse(self, response): item = MovieItem() selector = Selector(response) # 解析 movies = selector.xpath('//div[@class="info"]') for movie in movies: title = movie.xpath('div[@class="hd"]/a/span/text()').extract() fullTitle = '' for each in title: fullTitle += each movieInfo = movie.xpath('div[@class="bd"]/p/text()').extract() star = movie.xpath('div[@class="bd"]/div[@class="star"]/span[@class="rating_num"]/text()').extract()[0] quote = movie.xpath('div[@class="bd"]/p/span/text()').extract() if quote: quote = quote[0] else: quote = '' item['title'] = fullTitle item['movieInfo'] = ';'.join(movieInfo).replace(' ', '').replace('\n', '') item['star'] = star[0] item['quote'] = quote yield item nextPage = selector.xpath('//span[@class="next"]/link/@href').extract() if nextPage: nextPage = nextPage[0] print(self.url + str(nextPage)) yield Request(self.url + str(nextPage), callback=self.parse)
2021-07-10 17:02:46 14KB python scrapy 豆瓣电影 数据爬虫