Bigdata-movie 本项目以电影数据为主题,以数据采集、处理、分析及数据可视化为项目流程,可实现百万级电影数据离线处理与计算。 项目详解:. 开发环境:IDEA+Pycharm+Python3+hadoop2.8+hive2.3.0+mysql5.7+sqoop+spark 1.数据采集(pachong.py)、预处理: 采集豆瓣电影top250电影信息,采集电影名称、电影简介、电影评分、其他信息、电影连接等字段,抓取电影票房总收入排名情况(取前20),删除冗余和空值字,利用Python的PyMysql库连接本地Mysql数据库并导入movies表,可以将数据保存到本地,从而进行数据可视化展示,也可将数据导入到大数据的Hive数仓工具中,用于大数据分析。 采集数据展示: 排序 影片名称 类型 总票房(万) 场均人次 上映日期 1 战狼2 动作 567928 38 2017/7/27
2022-11-05 15:29:48 7.13MB Python
1
fontlist-v330.json文件来自.matplotlib
2022-11-05 10:39:21 156KB json
1
可选的配色方案: Accent, Accent_r, Blues, Blues_r, BrBG, BrBG_r, BuGn, BuGn_r, BuPu, BuPu_r, CMRmap, CMRmap_r, Dark2, Dark2_r, GnBu, GnBu_r, Greens, Greens_r, Greys, Greys_r, OrRd, OrRd_r, Oranges, Oranges_r, PRGn, PRGn_r, Paired, Paired_r, Pastel1, Pastel1_r, Pastel2, Pastel2_r, PiYG, PiYG_r, PuBu, PuBuGn
2022-11-04 15:58:38 713KB li lib mat
1
让你的matplotlib从入门到精通的50道题,最近很多人尝试。但41例开始缺少文档不能运行,我收索了相关资源整理了该文档可以正常运用。现提供给大家学习参考。 说明,41例运行前开始应修改为: import pandas as pd df=pd.read_excel('Pokemon.xlsx') 关注可查看补充上传的完整原代码
2022-11-03 22:57:24 63KB pokemon.csv matplotlib从入门到精通
1
根据国家标准《建筑抗震设计规范 》GB 50011 -2010 (2016年版)编制设计反应谱,并用Matplotlib进行可视化绘图。
2022-10-27 19:17:35 4KB Python matplotlib Seismic  Design
1
Python数据分析三部曲【matplotlib篇】.pdf
2022-10-27 14:04:20 1.26MB Python 数据分析 matplotlib
1
使用Python库研究数据集 在这个项目中,我分析了一个数据集,然后传达了关于它的发现。 我使用Python库NumPy,pandas和Matplotlib进行了分析。 我选择进行分析的数据集包含有关从电影数据库(TMDb)收集的10,000部电影的信息,包括用户评分和收入。 我分析了此数据集,以回答2个问题:1)哪些电影通常收入最高? 2)每年哪种类型最受欢迎? 在项目的“数据整理”部分,我加载了数据,检查其清洁度,然后修剪并清理数据集以进行分析。 在该项目的“探索性数据分析”部分中,我使用了内置的函数库来描述数据并对其进行可视化,最后总结了我的发现和结论。
2022-10-19 16:11:14 3.76MB HTML
1
主要介绍了python中matplotlib实现随鼠标滑动自动标注代码,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
2022-10-18 22:40:37 77KB python matplotlib 鼠标滑动 自动标注
1
需要使用jupyter
2022-10-16 18:07:22 596KB matplotlib
1
matlotlib常用的h几种图形
2022-10-16 18:07:21 142KB matplotlib
1