Gradient Boosting Decision Tree
2021-12-23 06:00:40 25.04MB GBRT MART
1
IPHIE-2018决策树 阿姆斯特丹IPHIE大师班2018的学生项目。 在R中使用决策树和随机森林分析数据集 糖尿病数据集-1999-2008年间美国130所糖尿病医院的数据集-https: 在Python中根据论文清理数据集-https:
2021-12-22 11:17:07 9.23MB JupyterNotebook
1
a) 您如何实现初始树(A 部分)以及为什么选择您的方法? 为了实现决策树,我们使用了 ID3(迭代二分法 3)启发式。 训练阶段 - 构建决策树: 在 ID3 算法中,我们以原始属性集作为根节点开始。 在算法的每次迭代中,我们遍历剩余集合中每个未使用的属性并计算该属性的熵(或信息增益)。 然后,我们选择具有最小熵(或最大信息增益)值的属性。 然后剩余的属性集被选定的属性分割以生成数据的子集。 该算法继续在每个子集上递归,只考虑以前从未选择过的属性。 测试阶段:在运行时,我们将使用经过训练的决策树对新的未见过的测试用例进行分类,方法是使用此测试用例的值向下处理决策树,以到达告诉我们此测试用例属于哪个类的终端节点。 我选择这种方法是因为以下原因: 它通过选择最佳属性来在每次迭代中拆分数据集,从而使用贪婪方法。 在离散数据上运行非常快(在 3 到 4 分钟内运行)。 但是,
2021-12-14 10:41:15 593KB Python
1
决策树实现预测贷款申请结果、预测隐形眼镜类型、
2021-12-12 23:55:05 27KB Decision Tree
1
R的决策树案例 用到的数据 这里是我在学习R的决策树过程中,写的一些例子代码,分别用到了三组不同的数据. R自带的iris UCI的 (全部是数值型) UCI的 用于性能测试 感谢为数据分析学习提供的这个数据库, 里面可以非常方便的找到你所需要的数据集。 下面是学习过程中阅读的一些参考文献: C50使用的入门教程: CART和rpart入门 关于经常会被作为参数的Formula 用到的R的分类算法包 C50 party rpart tree 在使用决策树算法时,我们常常要考虑以下几个问题: 如何建立分类模型 如何使用分类模型进行预测 如何查看分类树 如何评估预测结果 如何改进预测结果
2021-12-03 22:49:34 12.81MB Scilab
1
网络流量异常的检测和分类 实验基于 数据集的版本。 1.先决条件 1.1。 安装项目依赖项 不 姓名 版本 描述 1个 3.8.8 程式语言 2个 0.24.1 Python机器学习工具 3 1.19.5 Python科学计算工具 4 1.2.2 Python中的数据分析和数据处理工具 5 3.3.4 用Python可视化 6 0.11.1 统计数据可视化 7 5.8.0 跨平台库,用于检索Python中正在运行的进程和系统利用率(CPU,内存,磁盘,网络,传感器)的信息 8 0.3.7 可视化库 9 -- 用于模型序列化的Python对象序列化 1.2。 下载并提取数据集 下载的较轻版本(存档大小-8.8 GB) 较轻的版本仅包含带标签的流,而没有pcaps文件 提取档案(大小-大约44 GB) 2.安装项目 克隆此仓库 安装缺少的库 打开config.py并
1
决策树 对新患者进行分类的乳腺癌数据集的决策树。 训练数据 该模型是使用699例乳腺癌患者的数据集构建的。 数据集经过归一化和清洗,最终使500名患者接受了培训和测试的最终数据集。 共有500例患者,其中262例(52.4%)患有良性肿瘤,238例(47.6%)患有恶性肿瘤。 为了进行训练,使用了80%的数据,其中40%是良性肿瘤,40%是恶性肿瘤,其余20%用于测试。 在这20%中,12.4%来自良性肿瘤,而7.6%来自恶性肿瘤。 怎么跑 克隆存储库 启动你的服务器 现在,您可以从“决策树”中访问预测结果。 要查看命中率,请inspecionar并检查console 。 注释 src目录中的decision-tree.js文件已从以下存储库中删除,该存储库允许使用和修改: :
1
使用机器学习的软件定义网络中的TCP拥塞检测 本文的思想是使用决策树算法检测SDN网络中的拥塞 使用的工具 POX OpenFlow控制器(强烈建议使用OF版本1.3或1.5的基于Ryu Python的控制器)。 Mininet仿真器 Wireshark Iperf版本3 用于GNU图的Bash脚本 WEKA机器学习工具,用于训练和测试不同的决策树算法 定制Linux内核
2021-11-14 10:47:41 105.24MB machine-learning tcp sdn decision-tree-algorithm
1
菜菜完整机器学习教程,内含code和从参数说明,以及参考书目的目录等 01 决策树课件数据源码 02随机森林 03数据预处理和特征工程 04主成分分析PCA与奇异值分解SVD 05逻辑回归与评分卡 06聚类算法Kmeans 07支持向量机上 08支持向量机下等
2021-11-03 14:51:06 157.49MB sklearn decision tree random
1
id3 matlab代码多使用从头开始的决策树进行分类 介绍 利用决策树基于ID3算法对字母识别数据进行分类,得到混淆矩阵。 第一部分 该树是根据信息增益(IG)准则进行训练的。 第二部分 该树是根据基尼系数准则进行训练的。 第三方 拥有最大IG的两个属性被交换并训练了树。 第四部分 使用随机森林,将属性聚类为K折,并训练K树,并找到最准确的K。 通过两种方法实现,一种使用单元格(消耗内存),另一种使用嵌套查询。 代码中的详细信息! 数据集 数据集是一个Mat文件,可以使用MATLAB中的loadmat命令轻松读取。 它包括4000个测试和16000个训练的手写黑白字母,共26个班级。 每个实例具有16个特征,例如不同像素的数量,黑色像素的均值和方差以不同的方式等等。 该存储库中文件的描述 code/initial_tree.m :执行此文件以训练基于IG的决策树。 code/initial_tree_GINI.m :执行此文件以基于Gini索引训练决策树。 code/tree_changed_atts.m :第三部分 code/random_forest.m :包含第4部分。
2021-11-01 12:42:07 176KB 系统开源
1