AGNES和DIANA算法 AGNES (AGglomerative NESting)算法最初将每个对象作为一个簇,然后这些簇根据某些准则被一步步地合并。两个簇间的距离由这两个不同簇中距离最近的数据点对的相似度来确定;聚类的合并过程反复进行直到所有的对象最终满足簇数目。 DIANA (DIvisive ANAlysis)算法是上述过程的反过程,属于分裂的层次聚类,首先将所有的对象初始化到一个簇中,然后根据一些原则(比如最大的欧式距离),将该簇分类。直到到达用户指定的簇数目或者两个簇之间的距离超过了某个阈值。
2022-04-18 21:33:45 4.43MB 机器学习 聚类 最大熵模型 决策树
1
决策树C++实现 ,内附GBDT ADABOOST 随机森林的实现方法(其实这三个方法只是在决策树外部加几层循环即可实现,代码不超过30行)
2022-04-18 17:46:04 2.75MB 决策树 C++ DecisionTree 随机森林
1
【达摩老生出品,必属精品,亲测校正,质量保证】 资源名:决策树分类器在乳腺癌诊断中的应用研究_决策树分类器_乳腺癌诊断_matlab 资源类型:matlab项目全套源码 源码说明: 全部项目源码都是经过测试校正后百分百成功运行的,如果您下载后不能运行可联系我进行指导或者更换。 适合人群:新手及有一定经验的开发人员
机器学习实战项目——决策树&随机森林&时间序列预测股价.zip
本文主要介绍如何使用python的sk-learn机器学习框架搭建一个或多个:文本分类的机器学习模型,如果有毕业设计或者课程设计需求的同学可以参考本文。本项目使用了决策树和随机森林2种机器学习方法进行实验,完整代码在最下方,想要先看源码的同学可以移步本文最下方进行下载。 博主也参考过文本分类相关模型的文章,但大多是理论大于方法。很多同学肯定对原理不需要过多了解,只需要搭建出一个可视化系统即可。
2022-04-11 19:07:42 1.78MB python sklearn 决策树 随机森林
该资源为人工智能-机器学习相关算法详细讲解,包括K-近邻算法、线性回归、逻辑回归、决策树算法、集成学习、聚类算法以及拓展的理论和实践案例。
2022-04-06 19:06:33 46.82MB 算法 机器学习 人工智能 近邻算法
计算机视觉-决策树学习MATLAB源码 与其他的数据挖掘算法相比,决策树有许多优点: (1)易于理解和解释 人们很容易理解决策树的意义。 (2)只需很少的数据准备 其他技术往往需要数据归一化。 (3)即可以处理数值型数据也可以处理类别型 数据。其他技术往往只能处理一种数据类型。例如关联规则只能处理类别型的而神经网络只能处理数值型的数据。 (4)使用白箱 模型,输出结果容易通过模型的结构来解释。而神经网络是黑箱模型,很难解释输出的结果。 (5)可以通过测试集来验证模型的性能 。可以考虑模型的稳定性。 (6)强健控制. 对噪声处理有好的强健性。 (7)可以很好的处理大规模数据 。 缺点: (1)训练一棵最优的决策树是一个完全NP问题。因此, 实际应用时决策树的训练采用启发式搜索算法例如 贪心算法 来达到局部最优。这样的算法没办法得到最优的决策树。 (2)决策树创建的过度复杂会导致无法很好的预测训练集之外的数据。这称作过拟合。 剪枝机制可以避免这种问题。 (3)有些问题决策树没办法很好的解决,例如 异或问题。解决这种问题的时候,决策树会变得过大。
2022-04-06 14:09:06 269KB matlab 决策树 算法 计算机视觉
1
3.1 决策树(decision tree)算法
2022-04-06 03:09:59 9KB 算法 决策树 机器学习 人工智能
包括数据挖掘的概念,银行数据挖掘的步骤,机器学习的常用算法,决策树、线性回归、聚类分析的基本概念和在银行的应用场景。
2022-04-06 03:09:10 238KB 数据挖掘 算法 机器学习 决策树
在Hadoop大数据平台的基础上构建了一个基于MapReduce框架并行化的C4.5决策树算法,并采用此算法设计了一套银行贷款的风险预测系统。算法结合MapReduce框架、HDFS 文件存储系统,使用Java语言编写,根据贷款人的各个特征属性信息增益率来选择决策点。其中包含对连续值属性、离散值属性的处理,采用后剪枝悲观剪枝的方法对决策树进行剪枝,以避免决策树出现过拟合的特征。系统包含数据导入、数据分析、结果展示等模块,操作简单、快捷,能准确预测贷款人的信誉情况,平均准确率达到65%~80%,而且与传统的决策树模型相比在性能方面有更好的提升。
2022-04-04 22:33:10 70.54MB hadoop mapreduce 决策 java
1