尾花数据集是入门的经典数据集。Iris数据集是常用的分类实验数据集,由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。在三个类别中,其中有一个类别和其他两个类别是线性可分的。假设鸢尾花数据集的各个类别是服从正态分布的,尝试利用贝叶斯决策论的原理,
1. 设计贝叶斯分类器;
2. 设计基于最近邻准则的分类器。
资源包括代码实现和课程报告--Bayes和KNN分类器实现鸢尾花数据集分类
源码实现包括手撕贝叶斯和KNN以及使用工具包实现
课程报告主要包括以下部分:
一、 问题描述
二、 数据预处理
(1)划分数据集
(2)数据可视化
三、 模型基本原理
(1)朴素贝叶斯算法原理
(2)KNN算法原理
四、 贝叶斯分类器设计
(1)算法过程
(2)结果输出
五、 KNN分类器设计
(1)算法过程
(2)结果输出
六、 利用工具包进行设计
(1)贝叶斯分类器
(2)KNN分类器
1