case_pyspark
基于Python语言的Spark数据处理分析案例集锦(PySpark)
实验环境
1) Linux: Ubuntu 20.04
2) Python: 3.7.x
3) Spark: 2.4.5(安装教程:
4) Jupyter Notebook: (安装教程和使用方法:
案例
1) yelp: 基于YELP数据集的商业数据分析
2) us_counties: 2020年美国新冠肺炎疫情数据分析
3) ECommerce: 基于零售交易数据的Spark数据处理与分析
4) earthquake: 基于地震数据的Spark数据处理与分析
5) global: 基于Spark的地震数据处理与分析
6) OverDue: 基于信用卡逾期数据的Spark数据处理与分析
7) project: 基于 TMDB 数据集的电影数据分析
2021-12-04 21:30:51
7.04MB
HTML
1