购房者描述他们的梦想房屋,预测最终价格。问题转换为回归问题,评价标准时RMSE,从MSSubClass,MSZoning,LotFrontage等特征提取新的特征。考虑到评价指标是RMSE,本质是一个回归问题,模型融合时候可以使用多个回归模型进行stacker。采用数据清洗、特征工程、建模和高级回归技术,实现了对数据进行分析,分析数据之间的联系,数据的分布,数据的类型等,最终实现了堆叠回归预测房价,其主要功能包括预测销售价格并练习特征工程,RF和梯度提升,特点是堆叠回归,预测值与真实值误差小。 源代码:House price.py 训练集:train.csv 测试集:test.csv 提交样例:sample_submission.csv 最终提交:submission.csv
2021-09-08 09:46:34 211KB 机器学习 Python 房价高级回归技术
1
贝叶斯线性回归 通过(正常)线性回归和贝叶斯线性回归对数据建模的示例程序。 并显示图表以比较这两者。 环境 Python 2.7.6 麻木 Matplotlib 跑步 $ python bayesian_lr.py 图形 绿色:正态线性回归 蓝色:贝叶斯线性回归 逻辑 功能大致如下: 使用“高斯分布”作为基函数。 假设 s = 0.1,c_i = [0.0, 0.1, ..., 1.0]。 (1) 正态线性回归 这些“欧米茄”可以通过这个方程求解。 (2)贝叶斯线性回归 后验分布表示如下。 后验分布是高斯分布,所以最可能的值是: 因此,可以通过计算 Mu_N 来找出函数。 这一次,我假设 alpha = 0.1,beta = 9.0。 Phi 是如下矩阵。 麻木 numpy.linalg.solve :求解线性矩阵方程。 参考 numpy.dot :标量积,内
1
bounding box regression
2021-09-04 18:32:04 180KB bounding box regression
1
包含深度学习课程第一课第二周作业所需数据集、模块和相关代码。相关课程的作业的文档说明请搜索相关博客即可。 课程使用notebook做的,需要先安装juyter notebook。 在编程一开始需要导入python第三方库,包括numpy h5py matplotlib PIL scipy 统一使用pip下载安装,安装方法在命令窗口pip install 库名称 。 资源文件: assignment2.ipynb 是notebook文件可在网页book中打开,做好的作业和代码及运行结果都在里面; images 文件夹中是一些共测试的图片 datasets 文件夹中是本周课程用到的数据集,包括训练集和测试集; assignment2 文件夹是其他人做的作业; lr_utils.py 是课程提供的导入数据的模块,具体代码开始部分使用。
2021-09-04 16:18:22 4.75MB Logistic Regression Neural Network
1
Introduction to Applied Linear Algebra – Vectors, Matrices, and Least Squares
2021-09-04 05:32:01 4.37MB Applied  Linear  Algebra
1
#3.1_Regression_回归_(PyTorch_tutorial_神经网络_教学)
2021-09-01 21:00:06 29.1MB 学习资源
Coursera Machine Learning 第六周编程week6 ex5Regularized Linear Regression and BiasVariance编程全套满分题目+注释选做
1
IBM数据科学专业证书 关于此专业证书 数据科学是近十年来最热门的行业之一,对于能够分析数据并传达结果以告知数据驱动决策的数据科学家的需求从未如此高涨。 IBM的此专业证书将帮助有兴趣从事数据科学或机器学习职业的任何人发展与职业相关的技能和经验。 成为一名数据科学家需要博士学位,这是一个神话。任何对学习充满热情的人都可以获得此专业证书-无需具备计算机科学或编程语言的先验知识-并开发技能,工具和产品组合,以入门级数据科学家的身份在工作市场上具有竞争优势。 该计划包含9个在线课程,这些课程将为您提供最新的工作就绪工具和技能,包括开源工具和库,Python,数据库,SQL,数据可视化,数据分析,统计分析,预测建模和机器学习算法。您将通过使用真实数据科学工具和真实世界数据集的IBM Cloud中的动手实践来学习数据科学。 成功完成这些课程后,您将建立一个数据科学项目组合,以使您充满信心地涉足数据科
2021-08-31 15:31:19 15.59MB python data-science clustering regression
1
Statistics Book Focused on Linear Regression Analysis, for Students of Sciences and Engineering.
2021-08-31 14:24:53 9.58MB Statistics Mathematics Seber Lee
1
分类(Classification)与回归(Regression)都属于监督学习,他们的区别在于: 分类:用于预测有限的离散值,如是否得了癌症(0,1),或手写数字的判断,是0,1,2,3,4,5,6,7,8还是9等。分类中,预测的可能的结果是有限的,且提前给定的。 回归:用于预测实数值,如给定了房子的面积,地段,和房间数,预测房子的价格。 LinearRegression 拟合一个带有系数 w = (w1, …, wp) 的线性模型,使得数据集实际观测数据和预测数据(估计值)之间的残差平方和最小。 其数学表达式为: 进行预测前查看一下数据集 https://scikit-learn.org
2021-08-29 20:39:56 85KB ar IN io
1