本资源为机器学习实战的所有源代码。包含的内容有使用k-近邻算法改进约会网站的配对效果、使用k-近邻算法识别手写数字、使用决策树预测隐形眼镜类型、使用朴素贝叶斯过滤垃圾邮件、从疝气病症预测病马的死亡率、SVM手写识别问题回顾、利用AdaBoost元算法提高分类、线性回归预测鲍鱼的年龄、岭回归预测乐高玩具套装的价格、树回归、K-means对地理坐标进行聚类、Apriori算法发现毒蘑菇的相似特征、FP-growth算法从新闻网站点击流中挖掘、PCA对半导体制造数据降维、SVD基于协同过滤的推荐引擎、分布式SVM的Pegasos算法、用mrjob实现MapReduce版本的SVM。’
2022-04-30 13:06:16 12.72MB 机器学习 决策树 回归 支持向量机
线性回归的因变量 Y 必须为连续变量,但当我们研究的因变量为分类变量时,因为不再是随机变量,不符合正态分布,因此不能采用线性回归,此时应该使用Logistic 回归。 Logistic 回归分析也用于研究变量之间的影响关系,即 X 对Y 的影响情况,此处涉及的Y 是分类数据。结合 Y 的具体情况,Logistic 回归分析可以分为三种,分别是二元 Logistic 回归、多元无序 Logistic 回归和多元有序 Logistic 回归。Logistic 回归分析的分类情况如下图:
2022-04-28 11:10:58 536KB SPSS
1
Python中的轨迹分析和分类(Pandas和Scikit Learn) 一项针对数据挖掘研究生课程的大学项目。 给我们一个trainset,其中地理点与时间间隔成对。 首先,我们清理数据集,然后形成轨迹(具有相应的路线ID)。 本部分的最后一步是根据_their的total_distance和最大距离(它们的两个点之间)过滤掉一些轨迹。 该项目的目标首先是计算test_set_a1 / a2.csv和train_set.csv的轨迹之间的轨迹相似度。 用于该算法的算法是: 快速动态时间规整(Fast-DTW) ,取自 我实现的最长公共子序列算法。 每次考虑的距离是点的Haver
2022-04-13 21:36:53 24.33MB python machine-learning random-forest dtw
1
使用Logistic回归预测糖尿病得病率_多变量逻辑回归的python实现(Logistic Regression in Python)使用Logistic回归预测糖尿病得病率: 1.准备数据:用Python解析csv文件并填充缺失值 2.分析数据:可视化并观察数据 3.训练算法:使用优化算法,找到最佳的系数 4.测试算法:为了量化回归的效果需要观察错误率,根据错误率决定是否退到训练阶段,通过改变迭代次数和步长等参数来得到更好的回归系数。
2022-04-11 14:10:31 91KB python 回归 逻辑回归 开发语言
1
C++编写的Logistic回归分类器过滤垃圾邮件,采用了梯度下降法
2022-04-04 11:42:48 4KB Logistic回归
1
人力资源数据分析 使用Logistic回归对公司的人员流失进行HR数据分析。 一家名为XYZ的大公司在任何给定时间点都雇用大约4000名员工。 但是,每年约有15%的员工离开公司,并需要用就业市场上可用的人才库来代替。 管理层认为,这种流失率(员工自己离开或被解雇而离职)对公司不利,原因如下:•前雇员的项目被推迟,这使得他们难以按时完成任务,从而导致消费者和合作伙伴之间的声誉损失•为了招募新人才,必须维持相当大的部门•通常,必须对新员工进行工作培训和/或给予时间使其适应环境的培训因此,管理层已与人力资源分析公司签约,以了解他们应重点关注哪些因素,以减少人员流失。 换句话说,他们想知道应该对工作场所进行哪些更改,以使大多数员工留下来。 而且,他们想知道这些变量中的哪一个最重要,需要立即解决。 案例研究的目标:您需要使用逻辑回归模型对损耗的概率进行建模。 管理层将使用由此获得的结果来了解他
2022-03-22 17:51:20 1KB
1
七、变量筛选 从所用的方法看,有强迫法、前进法、后退法和逐步法。在这些方法中,筛选变量的过程与线性回归过程的完全一样。但其中所用的统计量不再是线性回归分析中的F统计量,而是以上介绍的参数检验方法中的三种统计量之一。 为计算方便,通常向前选取变量用似然比或比分检验,而向后剔除变量常用Wald检验。
2022-03-18 11:00:17 1.12MB logistic regression
1
Logistic 回归常用于分析二分类因变量与多个自变量的关 系, 本文通过案例解析分类变量的 Logistic 回归, 借助于 SPSS 软件 实现 Logistic 回归过程, 并对多分类因变量的 Logistic 回归做简单 介绍。
2022-03-10 20:01:54 2.66MB SPSS Logistic 回归分析
1
六、logistic逐步回归(变量筛选) MODEL语句加入选项“ SELECTION=STEPWISE SLE=0.10 SLS=0.10;” 常采用似然比检验: 决定自变量是否引入或剔除。
2022-02-24 19:47:29 1.06MB logistic
1
logistic回归为概率型非线性回归模型,是研究分类观察结果(y)与一些影响因素(x)之间关系的一种多变量分析方法
2022-02-06 14:04:29 1.03MB 回归 数据挖掘 人工智能 机器学习