R语言学习系列数据挖掘之决策树算法实现--ID3代码篇.pdf
2022-07-09 19:09:05 392KB 文档资料
决策树分类算法在银行个人信用评级中的应用.pdf
2022-07-09 19:09:00 3.61MB 文档资料
什么是机器学习分类算法?【K-近邻算法(KNN)、交叉验证、朴素贝叶斯算法、决策树、随机森林】.doc
2022-07-09 19:05:02 1.75MB 技术资料
Decision_tree-python 决策树分类(ID3,C4.5,CART) 三种算法的区别如下: (1) ID3算法以信息增益为准则来进行选择划分属性,选择信息增益最大的; (2) C4.5算法先从候选划分属性中找出信息增益高于平均水平的属性,再从中选择增益率最高的; (3) CART算法使用“基尼指数”来选择划分属性,选择基尼值最小的属性作为划分属性.
2022-07-09 13:05:03 1.36MB 机器学习 决策树 ID3 C4.5
商务智能-决策树在选课系统中的应用.ppt
2022-07-07 17:06:26 1.41MB 商务智能
3-决策树与集成算法.7z
2022-07-04 19:08:25 927KB 3-决策树与集成算法.7z
谁在买计算机? 年龄? 学生? 信誉? 青 中 老 否 是 优 良 决策树的用途 决策树算法 计数 年龄 收入 学生 信誉 归类:买计算机? 64 青 高 否 良 不买 64 青 高 否 优 不买 128 中 高 否 良 买 60 老 中 否 良 买 64 老 低 是 良 买 64 老 低 是 优 不买 64 中 低 是 优 买 128 青 中 否 良 不买 64 青 低 是 良 买 132 老 中 是 良 买 64 青 中 是 优 买 32 中 中 否 优 买 32 中 高 是 良 买 63 老 中 否 优 不买 1 老 中 否 优 买 第6章 决策树 买 不买 买 买 不买
2022-06-29 17:24:34 1.15MB 决策树
1
【对应博客内本章内容】 4.3 编程实现基于信息熵进行划分选择的决策树算法,并为西瓜数据集3.0中的数据生成一颗决策树。 4.4 编程实现基于基尼指数进行划分选择的决策树算法,为西瓜数据集2.0生成预剪枝、后剪枝决策树,并与未剪枝决策树进行比较。 4.6 选择4个UCI数据集,对上述2种算法产生的未剪枝,预剪枝,后剪枝的决策树进行实验比较,并进行适当的统计显著性检验。 原文链接:https://blog.csdn.net/m0_46345193/article/details/
2022-06-21 21:07:18 16KB 西瓜书 机器学习 决策树 python
支持向量机作为非参数方法已经广泛应用于信用评估领域.为克服其训练高维数据不能主动进行特征选择导致准确率下降的缺点,构建C4.5决策树优化支持向量机的信用评估模型.利用C4.5信息熵增益率方法进行属性选择,减少冗余属性.模型通过网格搜索确定最优参数,使用F-score和平均准确率评价模型性能,并在两组公开数据集上进行验证.实证分析表明,C4.5决策树优化支持向量机的信用评估模型有效减少了数据学习量,较于传统各类单一模型有较高的分类准确率和实用性.
1
现有某高校评教数据(pjsj.xls),共计842门课程,属性包括:课程名称、评价人数、总平均分以及10个评价指标Index1-Index10。以此为研究数据,利用数据挖掘的技术实现评价指标的筛选,即从10个指标中剔除对教学评价无用的指标。具体实现的内容应至少包括以下几个方面但不限于: (1)数据描述:利用盒图对每个指标数据进行描述性分析,画出10个指标的盒图:标注孤立点(如有)、最小值、Q1、中位数、Q3、最大值; (2)数据预处理:将每个连续型指标数据离散化为三个区间,级别从高到低分别为Excellent(用“E”表示)、Good(用“G”表示)、Fair(用“F”表示);将总平均分离散为“A”、“B”、“C”三个等次,作为每门课程的类标签; (3)模型构建与评估:利用决策树算法对上述数据进行分类,构建决策树并进行性能评估:包括Recall(召回率)、Precision(精度)、F1和Accuracy(准确率); (4)结果讨论:对研究结果(剔除的指标,即未出现决策树中的指标)进行讨论分析; (5)总结与展望:对全文研究过程进行总结并指出存在的不足或努力方向。
2022-06-20 14:07:48 8.74MB 数据挖掘 weka 期末大作业 决策树