本博客运行环境为Jupyter Notebook、Python3。使用的数据集是鸢尾花数据集(Iris)。主要叙述的是数据可视化。
IRIS数据集以鸢尾花的特征作为数据来源,数据集包含150个数据集,有4维,分为3 类,每类50个数据,每个数据包含4个属性,是在数据挖掘、数据分类中常用的测试集、训练集。
读取数据包括sklearn库引入和读取.csv文件保存的数据集。
显示数据包括显示具体数据、查看整体数据信息、描述性统计。
数据可视化包括散点图、直方图、KDE图、箱线图。
目录读取数据显示数据数据可视化
读取数据
从sklearn库中读取:(我使用的是该种办法)
,因为文件运行起来总缺少一
1