资源特点:基于北京交通大学《机器学习》课程作业,一共有4个案例 1.1 一元线性回归 1.2 1.2 多元线性回归/对数线性回归 1.3 对数几率回归 1.4 线性判别分析 每个案例配有详细的代码和解释,都能测试通过。 机器学习线性回归实验内容 一、实验内容 1.1 一元线性回归 使用Kaggle房价预测数据集: 1.打乱数据顺序,取前70%的数据作为训练集,后30%的数据作为测试集 2.分别以LotArea, BsmtUnfSF, GarageArea三种特征作为模型的输入,SalePrice作为模型的输出 3.在训练集上,使用最小二乘法求解模型参数(需自己实现,不允许第三方库完成) 4.计算三个模型在测试集上的MAE和RMSE这两种指标的大小(需自己实现,不允许第三方库完成) 5.分别绘制模型的在训练集和测试集上的曲线 6.选做:尝试去除训练集中的异常值或离群值后再次训练模型,绘制模型的预测曲线,观察模型在测试集上预测能力的变化 1.2 多元线
2022-02-24 14:12:19 2.23MB 机器学习 人工智能 python 线性回归
1
该代码实现了多元线性回归的一般过程,内容详尽,本人试验过,可以放心使用。该代码实现了多元线性回归的一般过程,内容详尽,本人试验过,可以放心使用。
2022-02-23 20:49:41 22KB matlab
1
贪心学院自然语言处理高级魔鬼训练营全面剖析自然语言处理领域前沿技术,包括预训练、对话系统、文本生成、知识图谱、信息抽取等。本资源是《第03章 机器学习基础 - 逻辑回归》的5.案例《预测银行客户是否会开设定期存款账户》的数据和参考代码。
回归问题它预测的是一个连续值而不是离散的标签。 本次要预测的是波士顿郊区房屋价格的中位数。 首先,我们通过keras加载数据集 from keras.datasets import boston_housing (train_data,train_targets),(test_data,test_targets) = boston_housing.load_data() 我们有404个训练样本和102个测试样本。每个样本都有13个特征值。 print(train_data.shape,'\n',test_data.shape) 目标是房屋价格的中位数 print(train_targets)
2022-02-23 10:15:09 191KB axis history num
1
可做地理加权回归分析(Geographical Weighted Regression),普通回归分析(Global Regression)也可以做,GWR输出时,具体有Bandwidth选择过程中间结果显示功能。
2022-02-22 22:08:33 2.52MB GWR
1
交叉验证调参与交叉验证评估的区别与使用 什么是交叉验证 交叉验证原理 交叉验证原理与常用方法 scikitlearn交叉验证评估 交叉验证:评估估算器的表现 在交叉验证中数据集一般可以分为训练集和测试集,其中训练集的某一折用于作为验证集,这样有利于充分利用数据,但是同样提升了计算量。交叉验证的使用往往时代码运行缓慢。 交叉验证的作用 交叉验证一方面可以用于调整超参数,也即是通过反复的交叉训练,找到模型最优的超参数,比如使用网格搜索GridSearchCV()。另一方面用于评估模型在数据集上的表现,比如cross_val_score()。 交叉验证评估: 针对在训练集上训练得到的模型表现良好,但
2022-02-22 16:18:02 275KB ar le 交叉
1
针对风电功率预测问题,在现有预测方法和概率性区间预测的基础上,提出基于深度学习分位数回归的风电功率概率预测方法。该方法采用Adam随机梯度下降法在不同分位数条件下对长短期记忆神经网络(LSTM)的输入、遗忘、记忆、输出参数进行估计,得出未来200 h内各个时刻风电功率的概率密度函数。根据美国PJM网上的风电功率实际数据的仿真结果表明,所提方法不仅能得出较为精确的点预测结果,而且能够获得风电功率完整的概率密度函数预测结果。与神经网络分位数回归相比,其精度更高,且在同等置信度下的预测区间范围更小。
1
使用线性、决策树和投票回归模型和来自 Kaggle 的数据预测体脂
2022-02-21 09:17:44 10KB Kaggle
1