预测泰坦尼克号乘客的生存-Kaggle竞赛
使用技能:NumPy,Pandas,Seaborn,scikit-learn(决策树分类器,SVM),xgboost(XGBClassifier),集成学习
挑战
泰坦尼克号的沉没是历史上最臭名昭著的海难之一。
1912年4月15日,在她的处女航中,被广泛认为的“沉没” RMS泰坦尼克号与冰山相撞后沉没。 不幸的是,船上没有足够的救生艇供所有人使用,导致2224名乘客和机组人员中的1502人死亡。
虽然幸存有一些运气,但似乎有些人比其他人更有可能生存。
在这一挑战中,我们要求您建立一个预测模型来回答以下问题:“什么样的人更有可能生存?” 使用乘客数据(即姓名,年龄,性别,社会经济舱等)。
我解决挑战的方法
处理数据以解决0,NaN等问题。
进行探索性数据分析以执行功能选择和工程设计
随机选择火车/测试区
训练决策树分类器,XGB分类器和S
1