上传者: 42101237
|
上传时间: 2021-12-03 09:18:25
|
文件大小: 3.51MB
|
文件类型: -
调查数据集
介绍:
我选择“ TMDb电影数据集”进行数据分析。 该数据集包含1000多个记录和21列。 它包括有关预算,收入,运行时间,演员,导演,体裁,发行年,电影受欢迎程度,观看者的评分,制作公司等信息。 该数据集可以帮助我们了解各种因素,例如过去几年的流派趋势,获利能力,过去几年的热门电影,过去几年的平均放映时间,顶尖导演和演员等等。 以下是使用Numpy,Pandas(Series和DataFrame)和Matplotlib进行分析的要点。
问题:
哪种类型的电影发行量最高?
关于投票数2.a。 哪些是前五部电影? 2.b. 谁是前5名演员? 2.c. 谁是前五名董事?
哪部电影3.a. 赚了最高和最少的利润? 3.b. 有最高和最低人气分数吗? 3.c. 收入最高和最低? 3.d. 有最高预算还是最低预算?
4.a. 哪一年的电影上映次数最多? 4.b. 哪一年的年