passengerid: 乘客 ID class: 舱位等级 (1 = 1st, 2 = 2nd, 3 = 3rd)** name: 乘客姓名 sex: 性别 age: 年龄 sibsp: 在船上的兄弟姐妹/配偶个数 parch: 在船上的父母/小孩个数 ticket: 船票信息 fare: 票价 cabin: 客舱 embarked: 登船港口 (C = Cherbourg, Q = Queenstown, S = Southampton) survived: 变量预测为值 0 或 1(这里 1 表示幸存,0 表示遇难)
2022-10-03 14:05:41 62KB python 机器学习 数据分析
1
使用机器学习决策树模型预测泰坦尼克号生存率。泰坦尼克号数据集和可执行代码(在jupyter或python中运行),图表及解释也有,参考博客一起食用最佳。
2022-03-14 16:00:06 39KB 决策树 泰坦尼克号 生存率 机器学习
1
本文介绍在恒定应力加速寿命试验下.产品生存率的Bayes 估计。应用该方法、至少可以摆脱下述的二个假设:(1)在任一个应力水平上产品的寿命分布都是相同或近似相同类型的;(2)产品失效分布的参数和使用的应力之间有已知函数关系.而第二个假设不尽合理,叫人难以接受,即使假定是合理的,却需要大样本去估计这种关系中的参数本文的方法摆脱这个假设,可适用于小样本的情形,最后给出一个例子.
2021-06-18 17:03:26 381KB 自然科学 论文
1
1个经典案例学会数据分析:泰坦尼克号生存率预测.pptx
2021-03-27 20:30:12 9.98MB 泰坦尼克 数据分析 案例
客户生存与流失预测 客户流失率是评估不断增长的业务的最重要指标之一。 虽然这不是最幸福的衡量标准,但它可以使您的公司了解保留客户的事实。 Heroku应用程序My Heroku应用程序: : 生存分析 生存分析是统计的一个分支,用于分析直到一个或多个事件(例如生物体死亡和机械系统故障)发生之前的预期持续时间。 Kaplan-Meier曲线(我的博客) 脚步 步骤1 问题定义 关键的挑战是预测单个客户是否会流失。 第2步 数据采集 用于此分类问题的数据集来自Kaggle,并来自IBM示例数据集集合( )。 第三步 探索性数据分析 收集数据后,将执行几个步骤来探索数据。 此步骤的目标是了解数据结构,进行初始预处理,清理数据,识别数据中的模式和不一致之处(例如,偏度,离群值,缺失值),并建立和验证假设。 第4步 特征工程 在特征工程中,从现有特征生成新特征,并在将所有特征转换
2021-03-04 15:07:46 7.78MB JupyterNotebook
1