钻石无处不在
介绍
在世界上,钻石因其美观和特性而成为人们最垂涎的对象。 他们昂贵的采购和稀缺性使钻石产品在市场上具有很高的价值。 但是,可以根据钻石的特性计算出该值吗?
在这个项目中,我们打算使用监督学习来创建预测模型,该模型使用一系列钻石变量来预测其他钻石的市场价值。
过程
打扫
清理过程首先检查数据集。 发现存在分类变量和数字变量的地方。 还观察到没有空值。 消除了无用的列,并对分类变量进行了编码,我们选择按序数形式对它们进行分类,因为存在分类顺序,因此考虑到顺序,将分类值替换为数值。
造型
使用的模型是线性回归,使用HyperOpt选择超参数的随机森林Reggresor,以及由Pycaret选择的第三个模型,最终将成为LightGradientBoostingMachine。
使用的度量是“ mean_square_error”。
数据
该项目使用的数据数据是从以下获得的
1