泰坦尼克号数据集分析 问题:有哪些因素会让船上的人生还率更高? 一、数据基本信息 #引入需要的包 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline #读取数据集 titanic_df = pd.read_csv('titanic-data.csv') titanic_df.head() 舱房等级越高生还率越高,女性生还率高于男性,儿童生还率高于其他年龄段。但是此结论有一定的局限性,实际上泰坦尼克号上有2224名乘客,而此数据集只有891名乘客的数据,另外也并不知道样本是如何选取的,样本量也不大,如果不是随机抽样,那么这个结论就不可靠了,而且可能还有其他数据集中没有的变量影响着生还率,比如乘客的身高、体重等等。
2024-06-10 17:17:07 222KB python
1
泰坦尼克号数据_泰坦尼克号数据分析报告 891名乘客中遇难乘客有549⼈,占61.6%,⽣还乘客342⼈,占38.4%.各等级船舱乘客⼈数 各等级船舱乘客⼈数 Pclass_count=titanic_data['Pclass'].value_counts().sort_index() #⽤Bar_pie()函数作条形图和饼状图 Bar_pie(Pclass_count) 三等船舱乘客最多,占55.1%;⼀等船舱次之占24.2%;⼆级船舱乘客最少,占20.7%.男⼥乘客分布情况 男⼥乘客分布情况 Sex_count=titanic_data['Sex'].value_counts() print(Sex_count) Bar_pie(Sex_count) male 577 female 314 Name: Sex, dtype: int64 男乘客有577⼈,占64.8%;⼥乘客有314⼈,占35.2%.乘客年龄分布情况 乘客年龄分布情况 In [84]: #乘客年龄分布直⽅图 #创建figure、subplot,并⽤hist作条形图 fig_Age=plt.figure(figsize=(10,5)) ax_Age=fig_Age.add_subplot(1,2,1) titanic_data['Age'].hist(bins=10,color='g',alpha=0.3,grid=False) #设置x轴刻度标签 ax_Age.set_xticks([0,10,20,30,40,50,60,70,80,90,100]) #添加标题,x轴标签,y轴标签 ax_Age.set_title('Hist plot of Age') ax_Age.set_xlabel('Age') ax_Age.set_ylabel('number of people') #乘客年龄分布箱线图 #作箱线图 plt.subplot(122) titanic_data.boxplot(column='Age',showfliers=False) #添加y轴标签 plt.ylabel('Age') plt.title('boxplot of Fare') titanic_data['Age'].describe() count 891.000000 mean 29.544332 std 13.013778 min 0.000000 25% 22.000000 50% 29.000000 75% 35.000000 max 80.000000 Name: Age, dtype: float64 乘客年龄⼤概成正态分布,平均年龄29岁多,最⼤的80岁,最⼩的不到1岁(利⽤int()取整,不到1岁的为0).兄弟姐妹、配偶在船上的 兄弟姐妹、配偶在船上的 乘客分布情况条形图 乘客分布情况条形图 #创建figure、subplot,⽤plot()作柱状图 fig_SibSp=plt.figure(figsize=(10,5)) ax_SibSp=fig_SibSp.add_subplot(1,2,1) SibSp_count=titanic_data['SibSp'].value_counts() SibSp_count.plot(kind='bar') #添加标题,x轴标签,y轴标签 ax_SibSp.set_title('Bar plot of SibSp') ax_SibSp.set_xlabel('number of SibSp') ax_SibSp.set_ylabel('number of people') #拥有各 数量的兄弟姐妹、配偶的乘客⽐例条形图 plt.subplot(122) SibSp_count.div(SibSp_count.sum()).plot(kind='bar') #添加标题,x、y轴 标签 plt.title('Ratio of people in SibSp') plt.xlabel('SibSp') plt.ylabel('ratio') 在船上没有兄弟姐妹配偶的乘客较多,占68.2%.⽗母、孩⼦在船上的乘客分布条形图 ⽗母、孩⼦在船上的乘客分布条形图 Parch_count=titanic_data['Parch'].value_counts() #创建figure、subplot,⽤plot()作柱状图 fig_Parch=plt.figure(figsize=(10,5)) ax_Parch=fig_Parch.add_subplot(1,2,1) Parch_count.plot(kind='bar') #添加标题,x、y轴标签 ax_Parch.set_title('Bar plot of Parch') ax
2024-06-10 17:06:49 197KB 文档资料
1
跑胡子java源码光学化学结构识别 - 基准 该存储库包含与公开可用的 OCSR 工具的基准研究相关的信息 材料和方法 为了比较三个可用的开源 OCSR 工具 Imago(2.0 版)、MolVec(0.9.7 版)和 OSRA(2.1.0 版)的结果,根据验证分析了多个在线免费提供的数据集OSRA 开发人员的程序 (4)。 数据集是:: 从 OSRA 在线网站 (4) 获得的一组 5719 张化学结构图像和相应的 molfiles(基于来自 USPTO 的数据)。 由英国伯明翰大学开发并与 MolRec (6) 一起发布的 5740 张图像和化学结构分子文件的数据集 (UOB)。 评估论坛会议和实验室 (CLEF) 测试集,包含 2012 年发布的 961 个图像和 molfiles (7)。 ChemInfty 发布的数据集的子集(450 个图像和 SD 文件)(见上文),基于日本专利局 (JPO) 的数据,从 OSRA 在线展示 (4) 获得。 (请注意,此数据集包含许多标签(有时带有日文字符)和不规则特征,例如线条粗细的变化。此外,有些图像质量较差,包含大量噪声。) TIFF
2024-06-10 13:14:50 59.48MB 系统开源
1
基于MATLAB的曲柄滑块机构的动态静力分析.pdf
2024-06-10 12:38:39 795KB matlab 论文期刊 专业指导
游戏陪玩陪支持语音聊天聊系统商业版附教程,此系统源码包含详细搭建教程及素材图,据说价值15980元 游戏陪玩软件为如今火热的电竞游戏增添了新的趣味玩法,让热爱游戏的你有了学习和交友的平台 商业版游戏陪玩陪聊系统最新h5版源码破解版(15980元完整开发版) v9.0版本更新功能如下 更新爆单模式 更新游戏陪玩员可以拒绝接单 更新所有人有订单,管理员都有推送 ---------------------------------------------------- 服务器配置:最低2核2g 系统选择:Linux系统 安装宝塔教程参考百度网络教程:https://blog.csdn.net/qq_35424400/article/details/119278295 以下插件在宝塔软件商店下载完毕 Nginx 1.20.2 php版本必须7.3 数据库:MySQL 8.0.24 MySQL管理工具:phpMyAdmin 5.0 ------------------------------------------------------- 大家好 直接进入教程环节 请准备好一
2024-06-10 10:02:23 274.05MB 课程资源
1
【作品名称】:基于R语言计算耐药率和数据分析 【适用人群】:适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。
2024-06-09 22:25:29 72KB r语言 数据分析
1
"海盗派测试分析.pdf" 海盗派测试分析.pdf 文件的标题、描述和标签中包含了大量有价值的IT知识点。在本节中,我们将对这些知识点进行详细的分析和解释。 首先,从标题和描述中可以看出,这个文件主要关于海盗派测试分析。海盗派测试是一种软件测试方法,主要用于检测软件系统的性能、可靠性和安全性。这种测试方法可以模拟真实世界中的各种场景,来检测软件系统在不同情况下的表现。 在互联网时代,软件测试变得越来越重要。因为互联网的普及,软件系统的使用范围不断扩大,软件系统的可靠性和安全性变得更加重要。海盗派测试就是一种检测软件系统可靠性和安全性的方法之一。 在标签中,我们发现了“互联网”这个关键词。互联网是现代社会的基础设施之一,对于软件系统的开发和运行产生了巨大的影响。互联网的普及使得软件系统的使用范围不断扩大,对软件系统的性能和安全性提出了更高的要求。因此,海盗派测试分析在互联网时代中的重要性不言而喻。 在海盗派测试分析中,通常会涉及到多种软件测试技术和方法,如黑盒测试、白盒测试、灰盒测试等。这些测试技术和方法可以从不同的角度来检测软件系统的性能和安全性。例如,黑盒测试可以模拟用户的行为,来检测软件系统的可用性和用户体验。白盒测试可以检测软件系统的内部逻辑和算法,来检测软件系统的性能和安全性。 此外,海盗派测试分析还涉及到软件测试的自动化。自动化测试可以大大提高测试的效率和准确性,降低测试的成本和时间。例如,使用自动化测试工具,可以快速地执行大量的测试用例,检测软件系统的性能和安全性。 海盗派测试分析.pdf 文件中的知识点涉及到软件测试、互联网、软件测试技术和方法自动化测试等方面。这些知识点对于软件开发和测试人员非常重要,可以帮助他们更好地理解软件测试的重要性和方法,提高软件系统的可靠性和安全性。 在软件开发和测试中,海盗派测试分析可以应用于多种场景,例如检测软件系统的性能和安全性、模拟用户行为、检测软件系统的可靠性和安全性等。这些应用场景对软件开发和测试人员非常重要,可以帮助他们更好地理解软件测试的重要性和方法,提高软件系统的可靠性和安全性。 海盗派测试分析.pdf 文件中的知识点对于软件开发和测试人员非常重要,可以帮助他们更好地理解软件测试的重要性和方法,提高软件系统的可靠性和安全性。
2024-06-09 20:39:44 40.7MB
【计算机组成原理实验】单周期cpu的实现_源码文件,平台:vivado single_cycle_cpu.rar
2024-06-09 18:28:44 8KB 计算机组成原理 Verilog 单周期CPU
1
很好的一个商业项目,采用 struts2 hibernater spring
2024-06-09 15:45:11 183.22MB java ssh
1
基于MATLAB的心电信号分析及滤波,刘明洋,李雅梅,本文主要介绍了心电信号的一些基本特点,并且利用FFT(快速傅里叶变换)对其进行频谱分析,然后采用FIR数字滤波器对心电信号进行去
2024-06-09 15:26:41 472KB 首发论文
1