上传者: 38659955
|
上传时间: 2022-04-02 23:02:23
|
文件大小: 2.42MB
|
文件类型: -
leetcode题库Bank_Marketing_Using_Pyspark_And_Using_Data_Science_Libraries。
在
Databricks
上使用
Pyspark
处理银行营销数据集,并使用
Python
在
Google
Colab
上仅使用数据科学库。
关于存储库
该存储库包含
2
个文件
-
使用
Pyspark
实现的银行营销数据集和仅使用
Python
的数据科学库实现的其他文件。
在
Databricks
上使用
Pyspark
-
此存储库包含与银行营销数据集相关的项目。
我已经应用逻辑回归、决策树和随机森林来比较算法在不同参数(如准确度、精度、召回率和许多其他参数)方面的比较。
还使用
5
折交叉验证进行了超参数调整,以评估与这些算法对应的模型并评估不同的参数。
在
Google
Colab
上使用数据科学图书馆
-
总而言之,首先对数据进行清理和预处理。
然后我将不同的参数性能与目标变量进行了比较。
然后我应用了
6
种机器学习算法,比较了训练和测试的准确性,并为它绘制了
ROC
曲线。
6
种机器学习算法是:逻辑回归、随机森林、支持向