红酒质量项目
关于这个项目
这两个数据集与葡萄牙“ Vinho Verde”葡萄酒的红色和白色变体有关。 有关更多详细信息,请参考参考文献[Cortez等,2009]。 由于隐私和物流问题,仅物理化学(输入)和感官(输出)变量可用(例如,没有有关葡萄类型,葡萄酒品牌,葡萄酒售价等的数据)。
数据源
目标
创建一个可以有效预测葡萄酒总体质量(好坏)的模型
数据字典
酒精度-葡萄酒中酒精度的百分比。
氯化物-葡萄酒中盐的含量。
柠檬酸-葡萄酒中的柠檬酸含量。 含量低会增加“新鲜度”和风味。
密度-葡萄酒的密度。
固定酸度-葡萄酒的固定酸度。
游离二氧化硫-葡萄酒中存在的游离二氧化硫水平。
is_good_wine-布尔值列,反映葡萄酒是劣质(质量1-5)还是“好”(质量6-10)。 (0 ==不好,1 ==很好)
pH-描述葡萄酒的酸性或碱性程度从0(非常酸性)到14(非常碱性)
1