Spark+MLlib机器学习实践+,王晓华著完整版,自己学习很实用
2023-05-02 09:23:18 37.52MB Spark MLlib 机器学习 王晓华
1
随机森林 这是 Spark 上随机森林算法的分布式实现。 这与 mllib 中可用的相同算法的实现不同。 在 mllib 中,随机森林算法是通过明智地拆分数据实例来实现的。 此实现是通过明智地拆分数据特征。 这种实现对于具有许多特征的数据非常有用。 我也做了一些即兴创作,删除了一些在这种实现方法中可以避免的类。 一个重要的改进是:现在,randomForest 的用户不需要提供 categoricalFeatureInfo(关于哪些是连续特征,一个分类特征包含多少类别的信息)作为输入。它现在被转换为一个 Option 这个实现会自动检测哪些是连续特征连续特征以及当 categoricalFeatureInfo 在用户输入中被指定为 None 时,分类特征包含多少个类别。
2022-06-04 03:47:54 1.02MB Scala
1
spark-mllib_2.11-2.1.3-SNAPSHOT.jars
2022-05-18 13:45:16 5.91MB spark-mllib_2.11
1
ML与Spark MLlib最佳实践,来自于阿里云得最佳实践操作......
2022-03-28 11:39:35 2.79MB spark
1
spark mllib 中的数据 支持向量机的数据
2022-03-20 15:48:36 102KB mllib 机器学习 数据 saprk
1
本PPT为世纪佳缘研发中心总监吴金龙对Spark的介绍,侧重Mllib机器学习,GraphX图处理两个模块。世纪佳缘在Spark集群上利用机器学习和图算法实现推荐算法。
2022-02-27 14:08:23 1.16MB Mllib GraphX Spark
1
本节主要介绍数据挖掘中常见的分类方法决策树和朴素贝叶斯算法。 决策树算法 决策树(Decision Tree,DT)分类法是一个简单且广泛使用的分类技术。 决策树是一个树状预测模型,它是由结点和有向边组成的层次结构。树中包含3种结点:根结点、内部结点和叶子结点。决策树只有一个根结点,是全体训练数据的集合。 树中的一个内部结点表示一个特征属性上的测试,对应的分支表示这个特征属性在某个值域上的输出。一个叶子结点存放一个类别,也就是说,带有分类标签的数据集合即为实例所属的分类。 1. 决策树案例 使用决策树进行决策的过程就是,从根结点开始,测试待分类项中相应的特征属性,并按照其值选择输出分支,直
2021-11-12 16:53:15 131KB mllib 信息增益 决策树
1
此课程主要介绍spark ml相关内容,共分10章,前2章主要介绍scala、spark原理,后面每章一个算法应用、算法原理和算法源码讲解,非常有帮助。
2021-10-12 20:35:48 75B spark ml
1
Spark机器学习
2021-10-06 10:54:18 45.91MB Spark ,机器学习
1
spark 机器学习使用的例子数据,sample_libsvm_data.txt
2021-09-29 18:53:49 102KB spark mllib
1