使用Python库研究数据集
在这个项目中,我分析了一个数据集,然后传达了关于它的发现。 我使用Python库NumPy,pandas和Matplotlib进行了分析。
我选择进行分析的数据集包含有关从电影数据库(TMDb)收集的10,000部电影的信息,包括用户评分和收入。 我分析了此数据集,以回答2个问题:1)哪些电影通常收入最高? 2)每年哪种类型最受欢迎?
在项目的“数据整理”部分,我加载了数据,检查其清洁度,然后修剪并清理数据集以进行分析。
在该项目的“探索性数据分析”部分中,我使用了内置的函数库来描述数据并对其进行可视化,最后总结了我的发现和结论。
2022-10-19 16:11:14
3.76MB
HTML
1