泰坦尼克号数据集分析 问题:有哪些因素会让船上的人生还率更高? 一、数据基本信息 #引入需要的包 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline #读取数据集 titanic_df = pd.read_csv('titanic-data.csv') titanic_df.head() 舱房等级越高生还率越高,女性生还率高于男性,儿童生还率高于其他年龄段。但是此结论有一定的局限性,实际上泰坦尼克号上有2224名乘客,而此数据集只有891名乘客的数据,另外也并不知道样本是如何选取的,样本量也不大,如果不是随机抽样,那么这个结论就不可靠了,而且可能还有其他数据集中没有的变量影响着生还率,比如乘客的身高、体重等等。
2024-06-10 17:17:07 222KB python
1
在加载时候程序出现用户系统,后台系统以及退出选项。 对于用户系统,在选择后出现用户登录和注册功能,在用户登录后,出现用户操作界面,并设计一下关于用户操作的基本功能:功能包含填报信息(信息内容为姓名,性别,部门),查询本人信息(查询时显示的信息是姓名,性别,部门,审核状态),修改自身的填报信息,修改自己账号的密码,退出功能。对于后台系统,在选择后出现管理员登录,在管理员登录后,出现后台操作界面,并设计一下关于后台操作的基本功能:其中功能包含查询所有用户填报的信息(采用模糊查询功能,即根据某个词查询关于这个词的信息),修改添加删除用户所填报的信息功能(信息包含姓名,性别,部门,审核状态),添加修改部门名称,审核用户状态的功能(用于审核用户提交的信息状态),退出功能。
2024-06-10 16:57:26 141KB python sqlite
1
利用Python库Selenium实现从Journal Citation Reports网站爬取期刊JCR缩写和ISO缩写。本文件于2024/3/9~3/12从JCR网站爬取,包含21762个期刊的名称、ISO缩写和JCR缩写,可直接导入Endnote等期刊管理软件使用。
2024-06-10 15:30:35 1.45MB python selenium
1
python根据小红书关键词爬取所有笔记评论,收集关键词热点,自动化采集数据工具。全源码交付,有教程说明。python爬取小红书搜索关键词下面的所有笔记的评论,情感分析、绘制词云图、词频分析、数据分析。
2024-06-09 21:22:08 2.03MB python 数据爬虫
1
完整项目代码 可作为毕设和课设 项目任务:将用户要记忆的单词,按字母排序后,存到文件中;用户输入要删除的单词,将其从文件中存储的单词也删除;用书输入要修改的单词,将其在文件中存储的单词也修改。
2024-06-09 20:56:08 145KB python
1
以python作为控制器,在simulink中搭建被控对象模型。技术点涉及python与simulink的数据交互、matlab实时仿真技术、python的数据可视化、增量式PID算法的编写等。有别于平时simulink仿真实验的模型和控制器同处一处,且仿真时间与CPU真实时间不同步。笔者将控制器和被控对象分离,实现远程的实时控制。
2024-06-09 11:08:05 36KB 实时仿真 python数据可视化
1
利用python爬取贝壳小区房产数据,稍微改一下,也可以爬取二手房,新房等信息
2024-06-08 22:06:11 631KB python 爬虫 源码
1
这个超市管理系统是为了方便超市管理者高效地管理超市的运营而设计的。它可以帮助管理者管理商品信息、库存和销售数据,以及用户信息。 具体来说,这个系统可以帮助管理者: 记录商品信息,包括商品名称、分类、描述、价格等。 管理库存,包括记录库存数量、进货和销售情况等。 记录销售数据,包括销售数量、销售时间等。 管理用户信息,包括用户名、密码、电子邮件、电话号码等。 通过这个系统,管理者可以更加高效地管理超市的运营,提高销售业绩和管理效率。同时,也可以更好地掌握商品信息和销售情况,以便做出更加明智的决策。
2024-06-08 14:48:39 2KB mysql
1
前端界面渲染
2024-06-08 11:53:29 665KB Javascript
1
python 实现遗传算法 课程设计 课程作业 Genetic Algorithm 基本字符串 Basic String 遗传算法是计算数学中用于解决最优化的搜索算法,是进化算法的一种。进化算法最初是借鉴了进化生物学中的一些现象而发展起来的,这些现象包括遗传、突变、自然选择以及杂交等等。 遗传算法通常实现方式为一种计算机模拟。对于一个最优化问题,一定数量的候选解可抽象表示为染色体,使种群向更好的解进化。 在遗传算法里,优化问题的解被称为个体,它表示为一个变量序列,叫做染色体或者基因串。染色体一般被表达为简单的字符串或数字符串,不过也有其他的依赖于特殊问题的表示方法适用,这一过程称为编码。首先,算法随机生成一定数量的个体,有时候操作者也可以干预这个随机产生过程,以提高初始种群的质量。在每一代中,都会评价每一个体,并通过计算适应度函数得到适应度数值。按照适应度排序种群个体,适应度高的在前面。这里的“高”是相对于初始的种群的低适应度而言。
2024-06-08 09:12:02 3KB python 课程资源 遗传算法 课程设计
1