C5.0是决策树模型中的算法,79年由J R Quinlan发展,并提出了ID3算法,主要针对离散型属性数据,其后又不断的改进,形成C4.5,它在ID3基础上增加了队连续属性的离散化。 C5.0是C4.5应用于大数据集上的分类算法,主要在执行效率和内存使用方面进行了改进。 C4.5算法是ID3算法的修订版,采用GainRatio来加以改进方法,选取有最大GainRatio的分割变量作为准则,避免ID3算法过度配适的问题。
2021-05-25 20:41:38 129KB 决策树分类
1
该内容共包含四部分代码,包含用python的sklearn包实现对kaggle上面泰坦尼克号的生存预测
2021-04-28 21:21:22 38KB 决策树 随机森林 器学习
1
在很多真实应用中,数据以流的形式不断被收集得到.由于数据收集环境往往发生动态变化,流数据的分布也会随时间不断变化.传统的机器学习技术依赖于数据独立同分布假设,因而在这类分布变化的流数据学习问题上难以奏效.
2021-01-31 14:18:44 1.74MB 流数据学习
1
监督学习包括线性模型、决策树模型、贝叶斯模型、支持向量机
1
基于 jupyterlab的决策树模型,decision_tree.zip
2021-01-28 03:40:03 280KB python 数据挖掘
1