上传者: 38627104
|
上传时间: 2021-10-15 21:11:19
|
文件大小: 5KB
|
文件类型: -
典型相关分析matlab实现代码
iris
一、简介
学习机器学习有一段时间了,由于以前使用的是matlab,所以想使用python来实现一些机器学习的问题。
鸢尾花分类问题时一个很经典的问题,我就想从这个问题入手吧。网上有一些相关的代码,但是我看到的几
个都有些肉眼可见的缺陷,所以,我索性把网上的参考抛开,按照自己的思路实现一个。
会有不少缺陷,求
大神轻喷
:)
二、iris数据集
Iris(鸢尾花)数据集是多重变量分析的数据集。
数据集包含150行数据,分为3类,每类50行数据。
每行数
据包括4个属性:Sepal
Length(花萼长度)、Sepal
Width(花萼宽度)、Petal
Length(花瓣长度)、
Petal
Width(花瓣宽度)。可通过这4个属性预测鸢尾花属于3个种类的哪一类。所以本项目是利用lr方法进行
多分类处理。引用Iris数据集的方法主要有在sklearn的sklearn库中导入iris数据集和下载官方的iris.csv文
件。本项目使用后一种获取数据的方法。
三、数据预处理
将数据集进行数据类型的转换,将Sepal
Length(花萼长度)、Sep