上传者: 38645266
|
上传时间: 2021-11-01 12:42:07
|
文件大小: 176KB
|
文件类型: -
id3
matlab代码多使用从头开始的决策树进行分类
介绍
利用决策树基于ID3算法对字母识别数据进行分类,得到混淆矩阵。
第一部分
该树是根据信息增益(IG)准则进行训练的。
第二部分
该树是根据基尼系数准则进行训练的。
第三方
拥有最大IG的两个属性被交换并训练了树。
第四部分
使用随机森林,将属性聚类为K折,并训练K树,并找到最准确的K。
通过两种方法实现,一种使用单元格(消耗内存),另一种使用嵌套查询。
代码中的详细信息!
数据集
数据集是一个Mat文件,可以使用MATLAB中的loadmat命令轻松读取。
它包括4000个测试和16000个训练的手写黑白字母,共26个班级。
每个实例具有16个特征,例如不同像素的数量,黑色像素的均值和方差以不同的方式等等。
该存储库中文件的描述
code/initial_tree.m
:执行此文件以训练基于IG的决策树。
code/initial_tree_GINI.m
:执行此文件以基于Gini索引训练决策树。
code/tree_changed_atts.m
:第三部分
code/random_forest.m
:包含第4部分。