探索性数据分析 机器学习模型 结论 所有特征都显示出对葡萄酒质量的影响。当考虑每个变量的相关性时,我们可以看到一些特征是相互关联的。这是因为固定酸、柠檬酸等特征是 pH 值等特征的一部分。主要发现是酸度对决定葡萄酒的质量有很大影响。此外,消费者表示,优质葡萄酒不应含有过多的残糖。这意味着非常甜的葡萄酒不是优质葡萄酒的特征。酒精含量的增加也被视为优质葡萄酒的一个特征,但不应增加到将葡萄酒归类为烈酒的程度。 从机器学习模型中,我们得到堆叠分类器和随机森林分类器比其他模型具有更高的性能。堆叠分类器是精度最高的分类器,达到 85.94%。我们可以看到,在不重新采样的情况下,准确度略有提高。因此没有 SMOTE 重采样的模型是最好的模型。可以通过使用 scikit learn 随机网格搜索调整这些模型的超参数来提高准确性 有问题可以call me
2022-02-21 09:17:46 1.71MB 数据分析 数据挖掘
Logistic回归教程-研究指南 李健镐2021 3 10 欢迎使用本教程! 本文是为那些没有R中Logistic回归经验的人撰写的。 如果您熟悉该理论,并且正在寻找更高级的技术,我建议您在“中”上搜索解释清楚的文章! 此外,本文可能会对在学术生活中从未进行过研究的本科生有所帮助。 我试图使其变得非常简单,以使这些新生可以掌握一个基本概念。 我想非常简单地提供从头到尾的一般研究方法。 我将逐一解释每个故事,就像介绍自己的故事一样。 你的爱好是什么? 您可能想知道为什么我问这个问题。 原因很简单。 通常,我会根据自己的喜好找到研究主题。 无论如何,让我们说清楚。 我是红酒的忠实粉丝。 自大流行以来,我什至无法数出我已经消费了多少葡萄酒。 因此,我开始怀疑是什么决定了红酒的口味。 我不是专家,我也从未去过葡萄酒农场。 假设我们只是好奇。 仅此而已。 您觉得我为什么在这里添加这些词吗
2021-12-20 15:52:36 560KB HTML
1
/ *日期:2018年5月7日作者:Raj Mehrotra * / 来自kaggle的“红酒质量”数据集。 数据集包含有关葡萄酒样品的详细信息,以及说明葡萄酒中不同化学物质浓度的不同特征。 目标变量是0-10的葡萄酒质量。 我首先探索并分析了数据,并使用了熊猫,matplotlib,seaborn库进行了可视化,并研究了不同类别和数字特征的分布。 然后,我清理了数据并准备好进行建模。然后,我还使用sklearn提供的StandardScaler缩放了所有数字功能以实现更好的性能。 最后,我从scikit学习中使用了不同的ML算法,包括SVM,RandomForest等。 我还使用GridSearchCV函数调整了所有算法的参数。 最后,通过使用带有“ rbf”内核和参数“ C”和“ gamma”的调整值的支持向量机,我在数据集上的精度为0.9175。
2021-11-25 08:01:14 495KB JupyterNotebook
1
Two datasets are included, related to red and white vinho verde wine samples, from the north of Portugal. The goal is to model wine quality based on physicochemical tests (see [Cortez et al., 2009], [Web Link]).
2021-11-06 14:16:18 129KB 机器学习 酒质量 数据集
1
R语言红酒质量经典数据集,字段有非挥发性酸性 挥发性酸性 柠檬酸 剩余糖分 氯化物 游离二氧化硫 二氧化硫总量 浓度 pH 硫酸盐 酒精 质量 等级 等级指 的是红酒最终质量等级,可作为标签
2021-07-01 21:21:59 127KB r语言 机器学习
1