采用KNN算法对鸢尾花品种分类与预测,预测的准确率达到了96.97%,可用于故障诊断与模式识别领域。具体步骤如下:
# 加载数据集
# 通过Matplotlib绘制鸢尾花每个品种的各个特征平均值的柱状图
# 划分数据集,留出法的实现数据集
# 对训练集和测试集进行索引重置,分别重置为从0开始的连续索引,得到训练集标签数据train_label、测试集标签数据test_label
# 训练集特征数据train_fea、测试集特征数据test_fea
# 数据归一化,由于不同特征的取值有明显的差别,取值较大的特征,特征变化往往比较大,这样会导致计算的距离结果更多地受到取值较大的特征变化的影响
# 数据集的多维特征对于距离计算是同等重要的,对特征进行归一化,即将特征的取值范围映射到0~1之间
# 建立评估函数,通过评估指标来评估模型预测的正确率
1