Python大数据处理库 PySpark实战-源代码
2022-04-15 13:15:02 1.82MB python 开发语言 Spark
1
pyspark-3.2.1
2022-04-06 14:07:48 268.33MB spark python
1
PySpark-ClusterClassify 使用AWS Sagemaker在MNIST数据集上进行分布式KMeans聚类和XGBoost分类作业
2022-04-03 16:34:56 671KB JupyterNotebook
1
leetcode题库Bank_Marketing_Using_Pyspark_And_Using_Data_Science_Libraries。 在 Databricks 上使用 Pyspark 处理银行营销数据集,并使用 Python 在 Google Colab 上仅使用数据科学库。 关于存储库 该存储库包含 2 个文件 - 使用 Pyspark 实现的银行营销数据集和仅使用 Python 的数据科学库实现的其他文件。 在 Databricks 上使用 Pyspark - 此存储库包含与银行营销数据集相关的项目。 我已经应用逻辑回归、决策树和随机森林来比较算法在不同参数(如准确度、精度、召回率和许多其他参数)方面的比较。 还使用 5 折交叉验证进行了超参数调整,以评估与这些算法对应的模型并评估不同的参数。 在 Google Colab 上使用数据科学图书馆 - 总而言之,首先对数据进行清理和预处理。 然后我将不同的参数性能与目标变量进行了比较。 然后我应用了 6 种机器学习算法,比较了训练和测试的准确性,并为它绘制了 ROC 曲线。 6 种机器学习算法是:逻辑回归、随机森林、支持向
2022-04-02 23:02:23 2.42MB 系统开源
1
在构建大数据开发平台的过程中,想用Python对大数据进行开发,从spark官网下载速度太慢,耗费好久才下载下来,在这里与大家共享。
2022-03-23 21:48:32 175.81MB Spark 大数据 hadoop pyspark
1
今天小编就为大家分享一篇pyspark 读取csv文件创建DataFrame的两种方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
2022-03-18 09:07:45 25KB pyspark csv DataFrame
1
Please note, this is MEAP version.
2022-03-17 21:08:49 24.19MB DataScience
1
推荐系统:Pyspark,ALS推荐系统
2022-03-11 18:01:15 101KB HTML
1
Perform effective data processing, machine learning, and analytics using PySpark Overcome challenges in developing and deploying Spark solutions using Python Explore recipes for efficiently combining Python and Apache Spark to process data
2022-02-11 23:48:29 6.58MB pyspark spark
1
波士顿房价预测相关代码
2022-01-16 23:21:02 185KB 波士顿房屋预测案例
1