借助虚拟变量, 在线性回归模型中引入品质标志, 使模型更完善; 运用虚拟变 量改变回归直线的截距、斜率; 虚拟变量既可作自变量, 又可作因变量; 灵活应用虚拟变量可以使许多复杂的问题简单化。
2021-12-22 21:47:39 159KB 虚拟变量 线性回归模型
1
使用 R 查看生产数据,收集见解以帮助 AutoRU 制造团队解决阻碍最新原型 MechaCar 生产的问题。线性回归分析、统计摘要和 t 检验有助于评估制造团队的情况,并提供有关生产开发的反馈,以实现更高质量的结果。 预测 MPG 的线性回归 通过使用线性回归模型,上表突出显示了哪些变量对数据集中的 mpg 值具有统计显着影响。因此,p 值小于 0.05(因此具有非随机方差)的类别是车辆长度(p = 2.60x10 -12)和车辆离地间隙(p =5.21x10 -08)。截距显示了 5.08x10 -08的 p 值,该值也特别低,表明在确定数据集中的 mpg 值时可能存在其他未考虑的因素。 线性模型的斜率不被认为是零。检查表底部的 p 值表明 p = 5.35x10 -11并且该值具有静态显着性,即有理由拒绝原假设并相信数据集中的变量之间存在相关性。 这个线性模型相当好地预测了 MechaCar 原型的 mpg,但并不完美。对于 0.7149 的倍数 R 平方值,模型有大约 71% 的机会准确预测变量将如何落在模型上。但是,同样,只有 71%,这个模型还有改进的空间。
2021-12-22 14:02:34 482KB R
上一次,写了MGD、SGD、MBGD的代码实现,现在,我们来康康实例 我们以大名鼎鼎的鸢尾花数据集为例: https://archive.ics.uci.edu/ml/machine-learning-databases/iris/ 下载这个iris.data即可 将其置于当前工作文件夹即可 先导入需要的库: import numpy as np import pandas as pd import random 然后将我们上一次写的函数copy过来: def MGD_train(X, y, alpha=0.0001, maxIter=1000, theta_old=None):
2021-12-21 21:10:18 78KB sgd 回归 大数据
1
对近期3个月内房价数据打标签,然后对影响房价的数据因数(比如:房屋住宅面积,房屋的房间数,房屋距离市中心的距离,房屋年限)作为输入变量,也就是训练数据,训练模型,找到数据模型及规律,一般利用梯度下降法,找出最优化影响因子权重,拟合最优解或者一条直线,然后对新数据进行预测
2021-12-21 09:36:29 2KB 机器学习 线性回归 python
1
内含线性回归代码,特征变体、波士顿小项目等代码
2021-12-21 09:14:40 228KB 机器学习 线性回归
梅蒂斯-路德 电影票房数据的网络抓取和线性回归(第 2-3 周) -
1
简单易用的小程序——不超过550KB——轻松解决二元一次的线性数据拟合问题 按照提示输入数据即可迅速得到所求的最优线性方程!
2021-12-16 16:39:07 548KB 线性回归 数据拟合
1
基本ML算法 最近邻居 逻辑回归 线性回归 朴素贝叶斯 K均值聚类
2021-12-15 22:34:33 1.89MB JupyterNotebook
1
线性回归实例选讲--牙膏的销售量 1. 问题 建立牙膏销售量与价格、广告投入之间的模型; 预测在不同价格和广告费用下的牙膏销售量. 收集了30个销售周期本公司牙膏销售量、价格、广告费用,及同期其他厂家同类牙膏的平均售价 . 9.26 0.55 6.80 4.25 3.70 30 7.93 0.05 5.80 3.85 3.80 29       8.51 0.25 6.75 4.00 3.75 2 7.38 -0.05 5.50 3.80 3.85 1 销售量 (百万支) 价格差 (元) 广告费用 (百万元) 其他厂家价格(元) 本公司价格(元) 销售周期
2021-12-14 11:12:30 1.45MB 建模 统计 数学
1
matlab的egde源代码机器学习 存储库包含我在MATLAB和PYTHON中实现的机器学习算法 使用的Alogrithm是: 决策树和随机森林分类器 朴素贝叶斯分类器 高斯朴素贝叶斯Calssifier 高斯混合的EM算法 神经网络 奇异值分解 主成分分析 将数据拟合到一维高斯 使数据适合2D高斯 K最近的邻居 线性回归 逻辑回归 K均值聚类 价值迭代法 动态时间规整 误差函数和正则化
2021-12-14 10:34:53 7.62MB 系统开源
1