文章目录数据选取和数据情况利用C4.5算法分类离散化连续变量C4.5原理C4.5实现应用训练好的决策树分类
数据选取和数据情况
本次实验选取鸢尾花数据集(http://archive.ics.uci.edu/ml/datasets/Iris)
数据包含5列,分别是花萼长度、花萼宽度、花瓣长度、花瓣宽度、鸢尾花种类。
鸢尾花属种类包含三种:iris-setosa, iris-versicolour, iris-virginica。
每一类分别是50条,共150条数据;每一类在四个属性的分布情况如下图所示
可视化代码
import pandas as pd
import matplotlib.
2021-04-12 20:58:46
368KB
分类
算法
花
1