上传者: 38750829
|
上传时间: 2022-02-28 20:53:17
|
文件大小: 1.8MB
|
文件类型: -
考试系统毕业设计项目含源码使用
Pandas
进行
Python
数据分析和可视化
我们将探索多个数据集:
可视化条件图
在本笔记本中,我们将探索构建在
matplotlib
之上的
seaborn
可视化库。
Seaborn
对更复杂的绘图有很好的支持,具有吸引力的默认样式,并与
Pandas
库很好地集成。
我们将研究由
Kaggle
编译的新泰坦尼克号数据集。
概述:数据分为两组:
I.
train.csv:包含
712
名乘客的数据
II.
test.csv:包含
418
名乘客的数据
两个数据集中的每一行代表泰坦尼克号上的一名乘客,以及有关他们的一些信息。
我们将使用
train.csv
文件,因为
Survived
列保留在文件中,该列描述了给定的乘客是否在坠机事故中幸存下来。
该列已在
test.csv
中删除,以鼓励参赛者练习使用数据进行预测。
以下是train.csv
中每一列的说明:
•PassengerId——分配给每位乘客的数字ID。
•
Survived
--
乘客是幸存下来(1),还是没有幸存下来(0)。
•
Pclass
--
乘客所在的舱位。
•
Nam