提出一种连续属性值域划分的离散化新方法,该方法定义一个新的离散化函数,依据类与属性之间的相互依赖关系选择最优的离散区间列表;此外,采用变精度粗糙集理论合理地控制数据离散化产生的信息丢失,减少分类错误。仿真结果和统计分析表明,提出的方法有较好的C5.0决策树分类能力。
1
python实现决策树(C4.5算法),使用西瓜数据集,参考《机器学习》和统计学习方法实现决策树算法。
2023-04-04 21:57:06 12KB C4.5 决策树 python 机器学习
1
基于监测数据及机器学习算法的湖泊水质实时评价技术对当前湖泊水资源的管理、维护和保护具有重要意义。本文针对巢湖水质的类别评价,利用随机森林(Random Forest, RF)分类算法对该区域水质进行类别判定。与其他算法相比,随机森林算法有着精度高、可容忍噪声强等诸多优点。测试结果表明,当决策树的棵数ntree=300,分裂属性集中属性个数mtry=2时,在合肥湖滨监测断面水质分类准确率可达96.15%,在巢湖裕溪口监测断面水质分类准确率高达100%,该方法具有稳健性较高、实用性强、泛化性能好等特点, 能够有效进行水质评价。

1
特征选择算法能够更好地提高入侵检测系统的检测速度和检测效果,消除冗余数据并减轻噪音特征.结合特征选择算法的优势,提出一种基于主成分分析(PCA)与决策树(C4.5)的入侵检测方法,进而构建出轻量级的入侵检测系统.通过在KDD1999数据集上对该方法进行详细的实验验证,证明该方法一方面确保系统有较高的检测率与较低误报率,另一方面能够比较显著地提高系统的训练时间与测试时间.同时,通过比较实验发现此方法在训练时间、测试时间、检测率、误报率上的效果也优于GA-SVM方法.
1
本设计基于决策树算法从多角度对某学校网上平台的学生行为数据进行分析,将根据学生的综合成绩将学生划分为三类:优秀(80分 – 100分)、良好(60分 – 79)、差(0分 – 59分)。这些数据包括到课率、预习率、习题正确率、综合成绩,数据量达千余条。通过已有数据建立决策树模型,供该平台未来的使用者进行预测,起到教学预警的作用。
2023-03-19 04:19:44 456KB 决策树 机器学习 行为数据
学习SVM 的很好的文档,可以好好交流一下
2023-03-13 08:47:40 485KB 决策树 SVM分类
1
歪斜 倾斜决策树和随机森林的 Clojure 实现。 用法 执照 版权所有 :copyright: 2015 FIXME 根据 Eclipse 公共许可证分发 1.0 版或(由您选择)任何更高版本。
2023-03-12 12:01:32 18KB Clojure
1
准确认定贫困生资格,是高校公平、公正、合理分配国家资助资源的先决条件.将数据挖掘的决策树方法引入高校贫困生资格认证分析中,利用C4.5算法创建决策树,挖掘学生信息和贫困种类关系的历史数据,建立学生信息―贫困种类智能评价模型.通过实验仿真发现,C4.5决策树算法取得了较为理想的分类预测效果.
2023-03-03 18:54:20 590KB 自然科学 论文
1
决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。Entropy = 系统的凌乱程度,使用算法ID3, C4.5和C5.0生成树算法使用熵。这一度量是基于信息学理论中熵的概念。 决策树是一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别。
2023-02-27 19:53:52 3.39MB 决策树
1
1. 提升树 boostring tree 是以决策树为基本学习器的提升方法 2. 对分类问题,提升树中的决策树是二叉决策树 3. 提升树模型可以表示为决策树
2023-02-27 19:49:58 1.91MB html 决策树 回归 算法
1