kaggle Quora Question Pairs
2022-02-21 17:07:32 364KB 深度学习
1
Kaggle 信用卡忠诚度预测
2022-02-21 14:30:16 349KB 机器学习比赛
1
探索性数据分析 机器学习模型 结论 所有特征都显示出对葡萄酒质量的影响。当考虑每个变量的相关性时,我们可以看到一些特征是相互关联的。这是因为固定酸、柠檬酸等特征是 pH 值等特征的一部分。主要发现是酸度对决定葡萄酒的质量有很大影响。此外,消费者表示,优质葡萄酒不应含有过多的残糖。这意味着非常甜的葡萄酒不是优质葡萄酒的特征。酒精含量的增加也被视为优质葡萄酒的一个特征,但不应增加到将葡萄酒归类为烈酒的程度。 从机器学习模型中,我们得到堆叠分类器和随机森林分类器比其他模型具有更高的性能。堆叠分类器是精度最高的分类器,达到 85.94%。我们可以看到,在不重新采样的情况下,准确度略有提高。因此没有 SMOTE 重采样的模型是最好的模型。可以通过使用 scikit learn 随机网格搜索调整这些模型的超参数来提高准确性 有问题可以call me
2022-02-21 09:17:46 1.71MB 数据分析 数据挖掘
使用 plotly 深入研究数据可视化。可以使用 plotly express 和 graph 对象来绘制一些带有数据的图表。 调查人群中的性别差距是显而易见的。女性在角色和薪酬方面存在巨大差异 很大比例的女性是学生。这表明如果这种趋势继续下去,未来性别差距将会缩小 统计学家使用 R 多于 Python。34% 的统计学家使用 R,而样本中的平均值为 9%
2022-02-21 09:17:45 3.15MB 机器学习 人工智能
使用 Python 中的 Pandas、Numpy、Seaborn 和 Matplotlib ,结论:重大事故发生在人口稠密的城市,高峰时间交通繁忙。良好的交通管理系统将大大减少事故数量。
2022-02-21 09:17:45 357KB python 数据分析 开发语言 后端
朴素贝叶斯算法在 Kaggle 上可用的肥料数据的应用 数据集来源:https ://www.kaggle.com/gdabhishek/counter-prediction
2022-02-21 09:17:44 42KB 算法 kaggle
使用线性、决策树和投票回归模型和来自 Kaggle 的数据预测体脂
2022-02-21 09:17:44 10KB Kaggle
1
kaggle工业蒸汽数据集
2022-02-17 19:11:24 366KB 数据集
1