使用Azure预测沃尔玛销售
在此存储库中,我们介绍了Microsoft Azure的Udacity纳米级程序机器学习工程师的Capstone项目。 在最后一个项目中,我们创建了两个模型来解决预测问题:一个模型使用Automated ML ,另一个模型使用HyperDrive调整了超参数。 然后,我们比较两个模型的性能,并将性能最佳的模型部署为Web服务。
特别是,我们选择Light GBM作为我们的自定义模型,以通过HyperDrive优化超参数。
架构图
数据集
总览
该项目中使用的数据集是Kaggle竞争提供的更大数据集的一小部分。
完整的数据集涵盖了美国三个州(加利福尼亚州,德克萨斯州和威斯康星州)的商店,并包括项目级别,部门,产品类别和商店详细信息。 此外,它具有解释性变量,例如价格,促销,星期几和特殊事件(例如超级碗,情人节和东正教复活节),这些变量通常会影响单位销售并可以
1