随着我国葡萄酒业的逐步发展,葡萄酒生产企业的规模和数量不断扩大。但中国的葡萄酒业仍面临着进口酒的激烈竞争以及质量检测体系不明确带来的市场紊乱。针对这些问题,本文分析了葡萄酒质量人工品尝存在的不足,并提出了如何提高基于数据挖掘技术的葡萄酒质量等级的识别率,对中国葡萄酒市场的稳定发展以及更好地酿造出高质量的葡萄酒有着实际的应用价值。在数据挖掘中,经常会遇到不平衡数据的分析。相对于多数类来说,少数类样本对准确率的影响力小,这意味着对所有样本进行分类,可以在不识别出任何少数类样本的情况下得到很高的正确率,识别少数类的分类规则也就被忽略了。本文的创新点在于从不平衡样本中提取平衡样本进行建模并对测试样本预测,进行多次的循环,得到多次的预测结果,选择次数出现最多的预测结果作为最终的预测结果,大大提高了低质量葡萄酒的识别率。本文采用BP神经网络对葡萄酒种类进行模式识别,通过对在意大利同一区域里三种的葡萄酒的化学成分分析,数据含有178个样本,每个样本含有13个特征分量,每个样本的类别标签已定。其中将这178个样本的65%作为训练样本,另外35%作为测试样本,用训练样本对BP神经网络进行训练可以得到相对应的分类模型,在利用训练好的模型对测试样本进行分类识别。
1