机器学习入门:手写数字识别,声呐分类,垃圾短信识别,鸢尾花分类 机器学习入门:手写数字识别,声呐分类,垃圾短信识别,鸢尾花分类 本系列代码是大多数初学者刚刚接触机器学习时会运行的代码,这些代码结构简单,原理清晰,易于实现。 项目均由jupyter notebook编写,适合分步骤运行,帮助理解每一步的功能。
2022-05-09 11:04:30 622KB 机器学习 分类 人工智能 数据挖掘
映射减少虹膜花 这些Map Reduce程序的目标是从著名的鸢尾花数据集中计算出萼片长度,萼片宽度,花瓣长度和花瓣宽度的最大值,最小值和平均值。
2022-05-04 14:30:29 10KB Java
1
利用Python实现KNN算法,完成鸢尾花分类任务,实现步骤: 1. 数据集的准备。 (1)使用SCIKIT-LEARN的自带的鸢尾花数据集,获取数据集的后两个特征,形成原始数据集D。 (2)待决策样本集D1的产生:在原始二维特征空间,基于该数据集的两种特征取值的最小值、最大值,获取该数据集的矩形包围盒,并在该的矩形区域上下左右各个方向扩充1的基础上,以step=0.02为两种特征的采样间隔,在该矩形区域等间隔抽取离散位置,构成原始待决策的样本集D1。 (3)训练集与测试集的产生:将原始数据集D按照类别分层随机打乱,以hold-out方式划分为训练集(80%),以及测试集(20%) 2. 模型的选择 训练集的规范化预处理,并记录预处理使用的参数。 3. 基于测试集的K-近邻分类模型的评价。 (1)对测试集的每个样本进行预处理; (2)基于K值优选结果(或你设定的K值),对预处理之后的每个测试样本进行类别预测,得到所有测试样本的类别预测结果。 (3)结合测试集各样本的类别预测结果及真实类别答案,生成混淆矩阵,并可视化混淆矩阵 .... 4.K-近邻分类模型的使用。 .....
2022-04-27 16:05:37 5KB 机器学习 分类 sklearn 人工智能
1
1.数据集的获取。 使用SCIKIT-LEARN的自带的鸢尾花数据集,获取该数据集150个样本的后两个特征及相应类别标签。 2.数据集的最小包围盒的获取,以及数据集的划分。 (1)获取原始二维空间中150个样本的最小包围矩形[x1_min, x1_max]*[x2_min,x2_max],并记录有关参数值。 (2)将数据集按照类别标签分层随机打乱,基于hold-out法,构建训练集(80%)与测试集(20%) 3. 模型的学习。 利用训练集,学习两种复杂程度不同的CART分类树,可视化两个分类树的学习结果。 4. 基于测试集的分类树的评价。 (1)结合测试集各样本的类别预测结果及真实类别答案,生成混淆矩阵,并可视化混淆矩阵 (2)基于混淆矩阵,估计每个类别的查准率、查全率、F1值,以及宏查准率、宏查全率、宏F1值;估计总体预测正确率. 5. 分类树的使用。 (1)在原始二维空间的矩形区域[x1_min-1, x1_max+1]*[x2_min-1,x2_max+1]内,分别在水平、垂直方向以0.02为间隔,细分生成离散格子点。 (2)分别以每个格子点作为一个待决策样本,对其分类
2022-04-27 16:05:35 5KB 分类 sklearn 数据挖掘 人工智能
1
1. 原始数据集的获取。 使用SCIKIT-LEARN的自带的鸢尾花数据集,获取原始鸢尾花数据集。 2.模型的评价方式之一--基于oob_score的模型性能评价 以整个鸢尾花数据集为训练集,分别考察: (1) 决策树数目=10,100,500三种情况下,随机森林的分类性能,性能评价采用: RandomForestClassifier模型的属性“oob_score” (2) 决策树数目=10,100,500三种情况下,bagging模型的分类性能,性能评价采用: BaggingClassifier模型的属性“oob_score” 3. 模型评价方式之二--基于交叉验证的集成模型性能评价 将原始数据集按照类别分层随机打乱,分成K=5等分. (1) 采用K-折交叉验证平均预测错误率(及标准差)为评价指标,分别考察决策树数目=10,100,500三种情况下,随机森林模型的分类性能。 (2) 采用K-折交叉验证平均预测错误率(及标准差)为评价指标,分别考察决策树数目=10,100,500三种情况下,bagging模型的分类性能。
2022-04-27 16:05:34 6KB 随机森林 分类 sklearn 算法
1
鸢尾花数据集iris 鸢尾花数据集iris鸢尾花数据集iris鸢尾花数据集iris鸢尾花数据集iris鸢尾花数据集iris鸢尾花数据集iris鸢尾花数据集iris鸢尾花数据集iris鸢尾花数据集iris鸢尾花数据集iris鸢尾花数据集iris鸢尾花数据集iris鸢尾花数据集iris鸢尾花数据集iris
2022-04-18 20:58:30 996B 鸢尾花数据集iris
1
简易KNN模型演示,鸢尾花的分类
2022-04-18 17:24:10 6KB matlab KNN 最近邻分类算法
1
使用matlab软件,利用贝叶斯方法实现鸢尾花的程序代码
2022-04-11 14:10:36 2KB matlab 开发语言
1