销售预测项目
该项目分析了在各个商店出售的食品的销售预测。 目的是帮助零售商了解在增加销售中起关键作用的产品和商店的属性。
目标:
探索性数据分析
数据清理
数据可视化
建立机器学习模型
随机森林
提供建议
数据清理
我使用python加载了数据集并导入了库,Pandas和Numpy,以开始探索数据。 前几个步骤需要验证数据类型并检查语法错误。 尽管所有数据类型都是一致的,但两列中缺少值。 在继续之前,Item_Fat_Content列中的语法存在一些需要更改的不一致之处。 例如,字符串是“ LF”,“ reg”,“ low fat”,需要将其映射到“ Low Fat”或“ Regular”下的字典中。
现在我们可以继续处理遗漏的值。 “ Outlet_Size”和“ Outlet_Type”中缺少值。 在填写缺失值之前,我创建了一个No Flag列,以防万一我想检查输入的值如何影响
1