上传者: 38724370
|
上传时间: 2021-07-20 13:22:58
|
文件大小: 47KB
|
文件类型: PDF
本博客运行环境为Jupyter Notebook、Python3。使用的数据集是鸢尾花数据集(Iris)。主要叙述的是数据可视化。
IRIS数据集以鸢尾花的特征作为数据来源,数据集包含150个数据集,有4维,分为3 类,每类50个数据,每个数据包含4个属性,是在数据挖掘、数据分类中常用的测试集、训练集。
读取数据包括sklearn库引入和读取.csv文件保存的数据集。
显示数据包括显示具体数据、查看整体数据信息、描述性统计。
数据可视化包括散点图、直方图、KDE图、箱线图。
目录读取数据显示数据数据可视化
读取数据
从sklearn库中读取:(我使用的是该种办法)
,因为文件运行起来总缺少一