只为小站
首页
域名查询
文件下载
登录
PySpark
-ClusterClassify:使用AWS Sagemaker在MNIST数据集上进行分布式KMeans聚类和XGBoost分类作业
PySpark
-ClusterClassify 使用AWS Sagemaker在MNIST数据集上进行分布式KMeans聚类和XGBoost分类作业
2022-04-03 16:34:56
671KB
JupyterNotebook
1
leetcode题库-Bank_Marketing_Using_
Pyspark
:在Databricks上使用
Pyspark
处理银行营销数据集
leetcode题库Bank_Marketing_Using_
Pyspark
_And_Using_Data_Science_Libraries。 在 Databricks 上使用
Pyspark
处理银行营销数据集,并使用 Python 在 Google Colab 上仅使用数据科学库。 关于存储库 该存储库包含 2 个文件 - 使用
Pyspark
实现的银行营销数据集和仅使用 Python 的数据科学库实现的其他文件。 在 Databricks 上使用
Pyspark
- 此存储库包含与银行营销数据集相关的项目。 我已经应用逻辑回归、决策树和随机森林来比较算法在不同参数(如准确度、精度、召回率和许多其他参数)方面的比较。 还使用 5 折交叉验证进行了超参数调整,以评估与这些算法对应的模型并评估不同的参数。 在 Google Colab 上使用数据科学图书馆 - 总而言之,首先对数据进行清理和预处理。 然后我将不同的参数性能与目标变量进行了比较。 然后我应用了 6 种机器学习算法,比较了训练和测试的准确性,并为它绘制了 ROC 曲线。 6 种机器学习算法是:逻辑回归、随机森林、支持向
2022-04-02 23:02:23
2.42MB
系统开源
1
spark-2.0.0-bin-hadoop2.6.tgz (内含有
Pyspark
2.7.12)
在构建大数据开发平台的过程中,想用Python对大数据进行开发,从spark官网下载速度太慢,耗费好久才下载下来,在这里与大家共享。
2022-03-23 21:48:32
175.81MB
Spark
大数据
hadoop
pyspark
1
pyspark
读取csv文件创建DataFrame的两种方法
今天小编就为大家分享一篇
pyspark
读取csv文件创建DataFrame的两种方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
2022-03-18 09:07:45
25KB
pyspark
csv
DataFrame
1
Data Analysis with Python and
PySpark
MEAP
Please note, this is MEAP version.
2022-03-17 21:08:49
24.19MB
DataScience
1
推荐系统:
Pyspark
,ALS推荐系统
推荐系统:
Pyspark
,ALS推荐系统
2022-03-11 18:01:15
101KB
HTML
1
pyspark
cookbook
Perform effective data processing, machine learning, and analytics using
PySpark
Overcome challenges in developing and deploying Spark solutions using Python Explore recipes for efficiently combining Python and Apache Spark to process data
2022-02-11 23:48:29
6.58MB
pyspark
spark
1
波士顿房价预测代码
pyspark
-python-sklearn
波士顿房价预测相关代码
2022-01-16 23:21:02
185KB
波士顿房屋预测案例
1
Python大数据处理库
PySpark
实战——使用
PySpark
处理文本多分类问题
【导读】我们知道,ApacheSpark在处理实时数据方面的能力非常出色,目前也在工业界广泛使用。本文通过使用SparkMachineLearningLibrary和
PySpark
来解决一个文本多分类问题,内容包括:数据提取、ModelPipeline、训练/测试数据集划分、模型训练和评价等,具体细节可以参考下面全文。ApacheSpark受到越来越多的关注,主要是因为它处理实时数据的能力。每天都有大量的数据需要被处理,如何实时地分析这些数据变得极其重要。另外,ApacheSpark可以再不采样的情况下快速处理大量的数据。许多工业界的专家提供了理由:whyyoushoulduseSparkfo
2021-12-26 15:38:30
438KB
Python大数据处理库PySpark实战——使用PySpark处理文本多分类问题
1
Windows本地
pyspark
环境搭载_spark环境搭载.doc
该资源为本地Windows下
pyspark
环境搭载,包含python、spark、hadoop、jdk、anaconda3、jupyter notebook(可参考资源进行搭载)如遇问题请查看专栏中的报错解决,亦可私信联系我
2021-12-24 17:08:34
1.81MB
本地spark环境搭载
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
狂神说全部笔记内容.zip
YOLOv5 人脸口罩图片数据集
现代操作系统原理与实现.pdf
东南大学英语技术写作慕课所有答案
神经·模糊·预测控制及其MATLAB实现PDF + MATLAB程序
python大作业--爬虫(完美应付大作业).zip
数据结构课后习题答案
王万良-人工智能导论(第五版)课件
长江流域shp.zip
Android大作业——网上购物APP(一定是你想要的)
scratch版 我的世界.sb2
pytorch实现RNN实验.rar
基于STM32的电子时钟设计
全国河流水文站坐标.xls
基于Python网络爬虫毕业论文.doc
最新下载
PB实现中文语音朗读
DLNA/Airplay无线投屏安卓接收端安装软件KXCast 0.2.7
LabVIEWFM&PM调制例程
Build Report Tool v3.9.unitypackage
掌讯3158规格书安卓导航主板掌
3518C-008-root-ZL-ota-20200104-ymqn.zip
掌讯刷机程序5.1.zip
计算机视觉教程(章毓晋微课版本第3版)期末复习部分习题
Qt5.9.9-mips64.tar.gz
Android课程设计报告.docx
其他资源
SentinelHASP读狗工具
MATLAB中fft函数用法、性质、特性、缺陷全面深入解析(含程序)
中科院虹膜数据库4.0
惯性导航程序
复旦大学半导体器件原理882真题(含2018)
SurfaceFlinger 视频教程 显示系统,内部机制,Vsync机制,HDMI系统
国科大2018秋季学期卜东波算法课期末考试试题
usbip_windows_v0.2.0.0_signed金品迪修正版openwrt
labview虚拟仪器程序设计从入门到精通(第2版)
IBM小型机安装linux
α-WO
GDI+学习心得1.docx
ACCESS大学考试题库大学生期末考试.pdf
MT45W8MW16BGX1_PSRAM(ENGLISH).pdf
fiddler--显示ip代码.txt
\51单片机实例35个
Discreteand combinatorial Mathematics
基于AD603程控增益大功率宽带直流放大器的设计
悬挂运动控制系统
C#调用打印机打印实例
UniBeast 9.1 for Mojave
C++ 多线程TELNET服务程序
计算机网络期末考试试卷及解答10套集合.zip