只为小站
首页
域名查询
文件下载
登录
PySpark
-ClusterClassify:使用AWS Sagemaker在MNIST数据集上进行分布式KMeans聚类和XGBoost分类作业
PySpark
-ClusterClassify 使用AWS Sagemaker在MNIST数据集上进行分布式KMeans聚类和XGBoost分类作业
2022-04-03 16:34:56
671KB
JupyterNotebook
1
leetcode题库-Bank_Marketing_Using_
Pyspark
:在Databricks上使用
Pyspark
处理银行营销数据集
leetcode题库Bank_Marketing_Using_
Pyspark
_And_Using_Data_Science_Libraries。 在 Databricks 上使用
Pyspark
处理银行营销数据集,并使用 Python 在 Google Colab 上仅使用数据科学库。 关于存储库 该存储库包含 2 个文件 - 使用
Pyspark
实现的银行营销数据集和仅使用 Python 的数据科学库实现的其他文件。 在 Databricks 上使用
Pyspark
- 此存储库包含与银行营销数据集相关的项目。 我已经应用逻辑回归、决策树和随机森林来比较算法在不同参数(如准确度、精度、召回率和许多其他参数)方面的比较。 还使用 5 折交叉验证进行了超参数调整,以评估与这些算法对应的模型并评估不同的参数。 在 Google Colab 上使用数据科学图书馆 - 总而言之,首先对数据进行清理和预处理。 然后我将不同的参数性能与目标变量进行了比较。 然后我应用了 6 种机器学习算法,比较了训练和测试的准确性,并为它绘制了 ROC 曲线。 6 种机器学习算法是:逻辑回归、随机森林、支持向
2022-04-02 23:02:23
2.42MB
系统开源
1
spark-2.0.0-bin-hadoop2.6.tgz (内含有
Pyspark
2.7.12)
在构建大数据开发平台的过程中,想用Python对大数据进行开发,从spark官网下载速度太慢,耗费好久才下载下来,在这里与大家共享。
2022-03-23 21:48:32
175.81MB
Spark
大数据
hadoop
pyspark
1
pyspark
读取csv文件创建DataFrame的两种方法
今天小编就为大家分享一篇
pyspark
读取csv文件创建DataFrame的两种方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
2022-03-18 09:07:45
25KB
pyspark
csv
DataFrame
1
Data Analysis with Python and
PySpark
MEAP
Please note, this is MEAP version.
2022-03-17 21:08:49
24.19MB
DataScience
1
推荐系统:
Pyspark
,ALS推荐系统
推荐系统:
Pyspark
,ALS推荐系统
2022-03-11 18:01:15
101KB
HTML
1
pyspark
cookbook
Perform effective data processing, machine learning, and analytics using
PySpark
Overcome challenges in developing and deploying Spark solutions using Python Explore recipes for efficiently combining Python and Apache Spark to process data
2022-02-11 23:48:29
6.58MB
pyspark
spark
1
波士顿房价预测代码
pyspark
-python-sklearn
波士顿房价预测相关代码
2022-01-16 23:21:02
185KB
波士顿房屋预测案例
1
Python大数据处理库
PySpark
实战——使用
PySpark
处理文本多分类问题
【导读】我们知道,ApacheSpark在处理实时数据方面的能力非常出色,目前也在工业界广泛使用。本文通过使用SparkMachineLearningLibrary和
PySpark
来解决一个文本多分类问题,内容包括:数据提取、ModelPipeline、训练/测试数据集划分、模型训练和评价等,具体细节可以参考下面全文。ApacheSpark受到越来越多的关注,主要是因为它处理实时数据的能力。每天都有大量的数据需要被处理,如何实时地分析这些数据变得极其重要。另外,ApacheSpark可以再不采样的情况下快速处理大量的数据。许多工业界的专家提供了理由:whyyoushoulduseSparkfo
2021-12-26 15:38:30
438KB
Python大数据处理库PySpark实战——使用PySpark处理文本多分类问题
1
Windows本地
pyspark
环境搭载_spark环境搭载.doc
该资源为本地Windows下
pyspark
环境搭载,包含python、spark、hadoop、jdk、anaconda3、jupyter notebook(可参考资源进行搭载)如遇问题请查看专栏中的报错解决,亦可私信联系我
2021-12-24 17:08:34
1.81MB
本地spark环境搭载
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
Spring相关的外文文献和翻译(含出处).zip
SSM外文文献和翻译(毕设论文精品).doc
vivado 破解 lisence(有效期到2037年) 下载
倒立摆的模糊控制(基于simulink仿真,适合初学者).rar
BP神经网络+PID控制simulink仿真
cublas64_11.dll cublasLt64_11.dll cusolver64_11.dll
OLED显示温度和时间-STM32F103C8T6(完整程序工程+原理图+相关资料).zip
基于javaweb的网上购物系统(毕业论文+答辩PPT+开题报告+源代码)
scratch版 我的世界.sb2
EEupdate_5.35.12.0 win10下修改intel网卡mac
matpower5.0b1.zip
QT自制精美Ui模板系列(一)桃子风格模板 - 二次开发专用
Android大作业——网上购物APP(一定是你想要的)
CUDA并行程序设计 GPU编程指南-中文扫描539页完整版pdf+高质量英文完整591页原版非扫描pdf
csma/ca和csma/cd的matlab仿真源代码带有详细的注释
最新下载
QT实现自定义多边形维度图
矩阵论学习辅导与典型题解析
十八种单按钮控制启停的程序
04_Autosar OS、RTE、上下电
STM32 LWIP 并发服务器
ISO3166 国家地区标准码 编码,中文名字,英文名字
磁盘文件变化监视小助手.rar
方易通平台卡标重启万能修复方法.rar
无限试用破解补丁aster脱机软件。
FPGA Verilog md5 加密 工程源文件源代码MD5.rar
其他资源
HALCON工业实用教程
Thermodel 中文操作教程
线性时变系统PID控制的matlab仿真程序
华为认证高斯数据库HCIA-GaussDB
SPI verilog代码
junit单元测试实验
基于STM32车牌识别程序_带管理计费.zip
CustomSystemWindow.rar
HP Z820 WS 加入nvme bios
fw 150r v1 v2 dd 教程加固件
ASP.NET MVC 4 图片上传UploadDemo
软件无线电--数字下变频原理及其技术研究
用PFC画颗粒级配曲线
rosdep update命令所生成的 .ros文件夹
Ld3320语音识别芯片的PCB封装以及芯片说明文档
unity可视化路径动画设计插件
android TextView 显示Gif 图片
BISS0001人体红外感应开关模块AD设计硬件原理图+PCB+封装库文件.zip
使用django+zeromq+tornado实现基于消息机制的websocket
大量MT4平台指标, MQ4源代码,
Halcon 汽车仪表盘识别
基于Qt+SQLite的简单的学生信息管理系统c++