搜索【titanic数据】的结果

kaggle泰坦尼克数据titanic

"kaggle泰坦尼克数据titanic"涉及的是一个著名的数据科学竞赛——Kaggle上的泰坦尼克生存预测挑战。这个挑战的目标是根据泰坦尼克号上乘客的信息，预测他们在船沉没时的生还情况。提供的数据集包含训练集（train.csv）、测试集（test.csv）以及一个示例提交文件（gender_submission.csv）。中提到的三个文件分别是： 1. **train.csv**：训练数据集，包含了乘客的特征和他们是否幸存的信息。这些特征包括但不限于乘客的年龄、性别、票价、船舱等级、登船港口等。通过这些数据，机器学习模型可以学习识别哪些特征与生还概率有关。 2. **test.csv**：测试数据集，用于评估模型的性能。它具有与训练集相同的特征，但不包含生还信息，参赛者需要预测这些乘客的生还状态并提交结果。 3. **gender_submission.csv**：这是一个示例提交文件，显示了如何组织结果文件。在这个例子中，假设所有女性乘客都存活，而男性乘客都未幸存。这是一种简单的基线策略，通常被用作比较其他更复杂模型性能的起点。在进行这个项目时，我们需要掌握以下几个关键知识点： 1. **数据预处理**：我们需要清洗和预处理数据，例如处理缺失值（如年龄、船舱等），将分类变量（如性别、船舱等级）编码为数值，可能还需要对连续变量进行标准化或归一化。 2. **特征工程**：这一步包括创建新的特征，如家庭大小（通过结合sibsp和parch列）、票价区间、船票类别等，这些新特征可能有助于模型学习。 3. **探索性数据分析（EDA）**：通过对数据的可视化和统计分析，了解不同特征与生还率之间的关系，如年龄分布、性别生存率差异、船舱等级的生存率等。 4. **机器学习模型选择**：可以选择多种模型，如逻辑回归、决策树、随机森林、支持向量机、梯度提升机（XGBoost或LightGBM）等。每种模型都有其优点和适用场景，需要根据问题特性和数据特性来决定。 5. **模型训练与验证**：使用交叉验证（如K折交叉验证）来评估模型性能，避免过拟合或欠拟合。同时，可以通过调整模型参数来优化模型。 6. **模型融合**：为了进一步提高预测准确率，可以使用模型融合技术，如投票法、堆叠泛化等，结合多个模型的预测结果。 7. **提交结果**：将测试集上的预测结果按照gender_submission.csv的格式整理成CSV文件，并上传到Kaggle平台以获取分数。在实际操作中，还需要熟悉Python编程语言，特别是Pandas库用于数据处理，NumPy用于数值计算，Matplotlib和Seaborn用于数据可视化，以及Scikit-learn用于构建和评估机器学习模型。此外，理解Kaggle平台的提交规则和评价指标（如AUC-ROC、准确率、精确率、召回率等）也是必不可少的。

2025-08-29 18:49:44 32KB titanic数据

1

Titanic数据集来自kaggle

2022-11-24 18:14:58 88KB 机器学习

1

kaggle泰坦尼克数据titanic

平台下载的原始三个数据train.csv test.csv gender_submission.csv （本来想0积分分享给大家无奈最低是1分了）

2022-11-21 08:29:47 32KB titanic数据

1

titanic数据集

泰坦尼克号预测生还数据集，PassengerId => 乘客ID Pclass => 乘客等级(1-一等舱，2-二等舱，3-三等舱) Name => 乘客姓名 Sex => 性别 Age => 年龄 SibSp => 兄弟姐妹/配偶的数量 Parch => 父母与小孩数量 Ticket => 船票信息 Fare => 票价 Cabin => 客舱 Embarked => 登船港口（C-瑟堡，Q-皇后镇，S-南安普顿）目标：预测survived(1-生存，0-死亡)

2022-11-01 20:18:56 77KB 数据集

1

titanic-数据集

Titanic dataset from kaggle.

2022-03-13 11:08:25 33KB 数据集

1

kaggle泰坦尼克数据titanic

平台下载的原始三个数据train.csv test.csv gender_submission.csv （本来想0积分分享给大家无奈最低是1分了）

2022-02-13 20:19:37 32KB titanic数据

1

titanic数据集.zip

train.csv数据集

2022-01-06 14:02:47 35KB Titanic数据集

1

Titanic数据集.zip

kaggle大赛Titanic数据集，之前去kaggle里下载太麻烦了，现在已经打包好了

2021-11-26 14:25:00 32KB Titanic数据集

1

Titanic数据集(gender_submission,test,train)

泰坦尼克号数据集，官网下载(gender_submission,test,train)，一共三个

2021-11-19 15:00:09 32KB gender_submi

1

kaggle_titanic数据集

去kaggle上下载资源太麻烦了，每次下载还要登录邮箱，没有的话基本等不上去，也就没法下载，所以就发到这里共享，里面有训练集，测试集。是最全的数据集了。

2021-09-21 10:05:39 34KB kaggle 数据集

1

个人信息

热门下载

最新下载

其他资源