Python的Spark:Python的Spark基础(使用PySpark),代码示例-源码

上传者: 42120541 | 上传时间: 2021-01-30 23:04:26 | 文件大小: 9.21MB | 文件类型: ZIP
用Python火花 Apache Spark 是技术领域中最热门的新趋势之一。 它是实现大数据与机器学习结合的成果的最大潜力框架。 它运行速度快(由于在内存中进行操作,因此比传统的快100倍,提供健壮的,分布式的,容错的数据对象(称为 ),并通过诸如的补充包与机器学习和图形分析领域完美集成和 。 Spark在上实现,并且主要用 (一种类似于Java的功能性编程语言)编写。 实际上,Scala需要在您的系统上安装最新的Java并在JVM上运行。 但是,对于大多数初学者来说,Scala并不是他们首先学习的语言,它可以涉足数据科学领域。 幸运的是,Spark提供了一个很棒的Python集成,称为PySpark,它使Python程序员可以与Spark框架进行交互,并学习如何大规模操作数据以及如何在分布式文件系统上使用对象和算法。 笔记本电脑 RDD和基础 数据框 使用Python 3和Jupyter Notebook设置Apache Spark 与大多数Python库不同,让PySpark开始正常工作并不像pip install ...和import ...那样简单。我们大多数基于P

文件下载

资源详情

[{"title":"( 102 个子文件 9.21MB ) Python的Spark:Python的Spark基础(使用PySpark),代码示例-源码","children":[{"title":"Word_Count.ipynb <span style='color:#111;'> 12.60KB </span>","children":null,"spread":false},{"title":"DataFrame_operations_basics.ipynb <span style='color:#111;'> 43.03KB </span>","children":null,"spread":false},{"title":"SparkContext_Workers_Lazy_Evaluations.ipynb <span style='color:#111;'> 9.91KB </span>","children":null,"spread":false},{"title":"Python Crash Course Exercises.ipynb <span style='color:#111;'> 8.26KB </span>","children":null,"spread":false},{"title":"Python Crash Course.ipynb <span style='color:#111;'> 34.45KB </span>","children":null,"spread":false},{"title":"......","children":null,"spread":false},{"title":"<span style='color:steelblue;'>文件过多,未全部展示</span>","children":null,"spread":false}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明