泰坦尼克数据集,可以参考文章: 【Pandas总结】第九节 Pandas 合并数据集_pd.pivot_table() 请大家下载学习;
2022-09-25 22:03:36 21KB titanic
1
整理competition提供的数据集,例如:特征过滤,数据归一化。 2. 在linear regression、logistic regression、neuron network或competition提供的算法中,挑出两个算法(必须选择一个实验课上使用的算法做实验,另外一个可以选择其他算法),在Titanic数据集上做十字交叉验证。 3.把每个数据集随机分为两份,一份做训练,另外一份做测试。使用两个算法在划分后的数据上做测试,并记录准确率。这个过程做5次,每次选择不同的训练样本比例(例如:训练样本占总样本的比例为10%, 20%, 30%, 40%, 50%, 初始比例和每次增加的比例,可以自己决定)。 4. 在报告中对数据集以及两个算法做简单描述;在Experimental Results部分介绍实验步骤,并展示实验结果。在Discussion and Conclusion部分对得到的实验结果对比分析。
2022-07-10 19:43:10 150KB 机器学习 Titanic 生存预测
1
Titanic-dataset:泰坦尼克号数据集Kaggle
2022-06-21 00:25:39 972KB JupyterNotebook
1
泰坦尼克号 这是我在参加 Kaggle 泰坦尼克号比赛时编写的 python/scikit-learn 代码。 有几种不同算法的代码,但主要和性能最高的一种是在 randomforest2.py 中实现的 RandomForest。 要求: python(2.x 版本至少为 2.6) scikit-learn/NumPy/SciPy ( ) 熊猫( ) matplotlib ( ) 用法: > python randomforest2.py 关键文件: loaddata.py:包含所有特征工程,包括用于生成不同变量类型、执行 PCA、聚类和类平衡的选项 randomforest2.py:执行管道的代码 scorereport.py:检查并报告超参数搜索的结果 learningcurve.py:包括生成学习曲线的代码 roc_auc:包括生成 ROC 曲线的代码 其他文
2022-05-25 21:02:15 63KB Python
1
kaggle的titannic数据集,用于机器学习的测试!!!!
2022-05-10 13:32:13 37KB kaggle titanic
1
泰坦尼克号人员数据集
2022-05-01 16:06:26 21KB 文档资料
1
机器学习实例不多,泰坦尼克号获救测试是一个比较好的,可是苦于没有训练数据,这是在github里面找到的数据,供大家分享。 https://github.com/alexisperrier/packt-aml/tree/master/ch4
2022-04-15 17:10:13 76KB pandas python titanic_train
1
dec-tree-random-forest-泰坦尼克号 使用决策树和随机森林模型预测泰坦尼克号乘客的存活率。 使用熊猫和 scikit-learn。 数据及比赛详情:
2022-03-16 10:07:41 36KB Python
1
Titanic dataset from kaggle.
2022-03-13 11:08:25 33KB 数据集
1
kaggle平台上titanic问题的数据 包含train test两个数据。
2022-02-28 18:26:12 31KB kaggle titani
1