针对C4.5算法在构建决策树过程中将条件属性与决策属性之间的信息增益率作为选择分裂属性的标准,而未考虑条件属性间相关性对结果影响这一缺点,提出了一种修正信息增益率的改进算法。首先计算当前分裂属性与各个条件特征间的平均信息增益,将其作为计算修正信息增益率的影响因素之一;然后使用高等数学中Taylor中值定理和Maclaurin公式的近似式,对修正后的信息增益率公式进行去除对数化简。将改进后的算法分别同原始算法和其他优化算法进行仿真实验,对比结果表明,本文改进后的C4.5决策树算法既提高了平均分类准确率,同时又提高了算法运行效率。
2021-12-26 13:52:48 1.26MB C4.5决策树 改进算法
1
决策树算法,学生专用,简单易懂,实验报告可用
2021-12-22 20:07:06 5KB 机器学习 决策树
1
本文针对交通数据挖掘领域的交通流预测问题进行研究和实现.主要对数据挖掘技术应用于交通流数据的特征选择和交通流预测模型的建立提出算法.在对采样数据进行清洗后,以分类与回归决策树作为基学习器,采用梯度提升决策树进行回归拟合,计算出交通数据的特征重要度.并以此重要度作为自适应特征选择的依据.其次,采用聚类算法对选取后的特征数据进行聚类分析,缩小样本大小的同时,同类数据更加相似.最后,以实时数据匹配相应聚类作为训练数据集,使用经过人工鱼群算法优化参数后的支持向量机进行交通流预测.本文结尾通过实验数据论证本文所提出的算法和模型.
1
决策树概述与应用举例,数据挖掘课程读书报告
2021-12-22 16:39:04 246KB 决策树 数据挖掘
1
决策树 2015 年 5 月作者:张天和秦敬尧课程:机器学习,西北大学,伊利诺伊州埃文斯顿 我们在这个项目中实现了基于 C4.5 算法的决策树模型。 DecisionTree.py 是包含主要功能的执行文件,c45.py 包含 C4.5 和剪枝算法。 ##如何运行代码要运行程序,请以以下格式之一键入命令行: Format_1: python filename.csv(execute) train unpru filename.csv(train) ratio filename.csv(metadata) Format_2: python filename.csv(execute) train pru filename.csv(train) ratio filename.csv(metadata) filename.csv(validate) Format_3: python filenam
2021-12-22 10:40:03 2.71MB Python
1
决策树预测算法 项目:决策树 创建决策树分类器并以图形方式对其进行可视化。 目的是,如果我们向该分类器提供任何新数据,它将能够相应地预测正确的分类。 请找到以下文件: 1. Required .ipynb file. 2.Provided data. 3.Decision Tree in .png file form.
2021-12-22 00:18:55 1.01MB JupyterNotebook
1
数据挖掘导论小结
2021-12-21 10:02:24 21KB K-Means kdd 决策树 神经网络
1
SPSS_Statistics 做决策树分析,药物治疗分析方法介绍
2021-12-19 12:56:37 729KB spss 决策树 药物治疗分析
1
EDA和ML项目 存储库包含各种项目,这些项目都使用R语言编写了以下代码: 探索性数据分析 机器学习模型(线性回归,逻辑回归,k均值聚类,分层聚类,SVM,决策树,随机森林,时间序列分析,XGBoost) 以下是一些常用的程序包/库的列表,这些程序包/库被用作数据分析和构建机器学习模型的一部分 数据处理: dplyr,plyr,tidyr,stringer,data.table,lubridate(用于日期处理), 数据可视化: ggplot2,cowplot,ggthemes,比例 ML模型: randomForest,caret(用于数据拆分,交叉验证,预处理,特征选择,变量重要性估计等) 推荐模型: re荐 文本挖掘: tm,tidyverse
2021-12-17 12:54:13 26.84MB r random-forest clustering linear-regression
1