二手车价格预测 探索具有随机森林和正则化的二手车价格预测模型。 我使用R进行数据可视化,数据插补和模型选择。 涉及的主要软件包是Hmisc,ggplot2,randomForest和glmnet。 我们正在寻求使用随机Forst和正则化技术的特征选择和预测算法。 方法是随机森林,山脊,套索和弹性网回归。 事实证明,弹性模型可以大幅度减少维数,并保持良好的预测能力。
2022-11-28 14:55:20 7KB
1
资源包含文件:设计报告word和pdf两个版本+源码及数据 box-cox 变换目标值“price”,解决长尾分布。 删除与目标值无关的列,例如“SaleID”,“name”。这里可以挖掘一下“name”的长度作为新的特征。 异常点处理,删除训练集特有的数据,例如删除“seller”==1 的值。 缺失值处理,分类特征填充众数,连续特征填充平均值。 其他特别处理,把取值无变化的列删掉。 异常值处理,按照题目要求“power”位于 0~600,因此把“power”>600 的值截断至 600,把"notRepairedDamage"的非数值的值替换为 np.nan,让模型自行处理。 详细介绍参考:https://blog.csdn.net/sheziqiong/article/details/125362504
2022-11-02 14:46:21 1.85MB Python 二手车 价格分析 价格预测
数据可以在官网下载 方案与文件
2022-05-31 09:12:11 1.59MB 源码软件 阿里天池 二手车价格
2022-04-29 10:58:12 38.42MB 数据集
1
目录:keycap_0: 前言:keycap_0:.:keycap_1: 赛题重述:keycap_0:.:keycap_2: 数据集概述:keycap_1: 数据处理:keycap_2: 线性回归:keycap_2:.:keycap_1: 简单建模:keycap_2:.:keycap_2: 处理长尾分布:keycap_3: 五折交叉验证¶(`cross_val_score`):keycap_3:.:keycap_1: `cross_val_score`相应函数的应用:keycap_3:.:keycap_2: 考虑真实世界限制:keycap_3:.:keycap_3: 绘制学习率曲线与验证曲线¶:keycap_4: 多种模型对比:keycap_4:.:keycap_1: 线性模型 & 嵌入式特征选择:keycap_4:.:keycap_1:.:keycap_1: `LinearRegression`,`Ridge`,`Lasso`方法的运行:keycap_4:.:keycap_1:.:keycap_2: 三种方法的对比:keycap_4:.:keycap_2: 非线性模型:keycap_
2021-12-09 23:01:08 170KB AS 二手车 调参
1
:automobile: :money_bag:我的车值多少钱? :robot:二手车价格预测解决方案的原型 该项目的目的是创建一个完整的机器学习原型,从探索性数据分析到模型部署和用户界面开发。 在此存储库中,您可以找到: 作者
2021-11-18 14:45:01 14.22MB JupyterNotebook
1
人人车二手车数据用于机器学习二手车价格预测,数据为json格式,二手车数据属性包含:售价、行驶里程、车牌所在地、保险信息、出厂日期、以及车辆的详细配置信息,大概有180-200个属性,内容丰富,属于爬取的原始数据,未经处理,正好用于数据处理与分析练手所用。
2021-06-11 22:39:52 7.61MB 二手车 机器学习 价格预测 人人车
1
used_car_train_20200313.csv
2021-04-12 18:01:30 51.77MB 二手车价格预测
1
阿里云天池比赛——二手车交易价格预测数据集,包含训练集和测试集B。用于入门机器学习数据挖掘的非常好的比赛。
1
该数据来自某交易平台的二手车交易记录,总数据量超过40w,包含31列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取15万条作为训练集,5万条作为测试集A,5万条作为测试集B,同时会对name、model、brand和regionCode等信息进行脱敏。
2021-03-12 17:05:45 28.71MB 训练数据 二手车价格预测
1