资源为.ipynb格式。可以用jupter nootboke打开
对kaggle泰坦尼克号辛存者预测竞赛的一点小总结
1.首先提出了对数据分析思维的一些tips(不感兴趣的可以跳过)
2.对数据分析的流程做了一个文本的总结。
由数据探索-->特征工程-->建模三部分组成
2.1 数据探索:探索特征的类型,缺失情况等等
2.2 特征工程:简要介绍数据的填充,删除,增补等等方法
2.3 建模:对可以使用的分类算法做一些比较,优先选择比较好的算法来进行集成学习(有借鉴一些大神的思路 , 但是因为找不到原来的网址了,没有附加超链接,如果以后有遇见相似的文本,希望各位发个消息,我再加上链接,谢谢!)
1