本资源为机器学习实战的所有源代码。包含的内容有使用k-近邻算法改进约会网站的配对效果、使用k-近邻算法识别手写数字、使用决策树预测隐形眼镜类型、使用朴素贝叶斯过滤垃圾邮件、从疝气病症预测病马的死亡率、SVM手写识别问题回顾、利用AdaBoost元算法提高分类、线性回归预测鲍鱼的年龄、岭回归预测乐高玩具套装的价格、树回归、K-means对地理坐标进行聚类、Apriori算法发现毒蘑菇的相似特征、FP-growth算法从新闻网站点击流中挖掘、PCA对半导体制造数据降维、SVD基于协同过滤的推荐引擎、分布式SVM的Pegasos算法、用mrjob实现MapReduce版本的SVM。’
2022-04-30 13:06:16 12.72MB 机器学习 决策树 回归 支持向量机
本文描述了最新的回归技术随机森林分位数回归森林(QRF)的新扩展,以应用于具有数千个特征的高维数据。 我们提出了一种新的子空间采样方法,该方法从两个单独的特征集中随机抽取一个特征子集,一个特征集包含重要特征,另一个特征集包含次要特征。 这两个功能部件集基于功能部件的重要性度量对输入数据进行分区。 通过使用特征置换产生分区原始重要性特征评分首先进行,然后应用p值评估将重要特征与次要特征分开。 新的子空间采样方法能够从袋装样本数据生成树,而回归误差较小。 对于点回归,我们从两个分位数Q0:05和Q0:95之间的范围中选择Y的预测值,而不是回归随机森林中使用的条件均值。我们的实验结果表明,具有这些扩展的随机森林要优于回归随机森林和分位数回归森林减少均方根残差。
2022-04-29 20:10:19 358KB Regression Random Forests; Quantile
1
这是西瓜书第三章练习题对率回归数的据集
2022-04-28 21:05:59 10KB 回归 数据挖掘 人工智能 机器学习
1
概述 调用sklearn.linear_model中的LogisticRegression库,尝试通过对率回归对离散数据进行划分,对每个属性进行预测,选取正确率最大的属性作为根节点,并对该节点的每个属性取值进行划分选择,依此类推,最终绘制一棵决策树。 程序功能 对于给定西瓜数据集3.0,将字符串类型的属性取值转换为数值类型以便模型进行训练,并将连续属性离散化以便选取划分点,通过正确率来选取根节点,最终得到决策树数组。通过dealanddraw(n0, pngname)函数将数组转化为字典类型,绘制决策树,将决策树以图片形式保存在程序的同一目录下。 收获 通过该代码读者能够掌握机器学习课程中对率回归决策树的基本绘制方法,能够根据自己的需求快速的更换数据集,具有一定的应用价值。 不足 对于正确率相同的节点,选取优先遍历的属性作为根节点,与基于信息增益进行划分选择的方法相比,可知两种方法绘制的决策树正确率均为100%,但对率回归方法容易忽略在同一正确率下划分较佳的节点,从而使决策树层数增多,变得更加复杂。
2022-04-28 16:06:41 362KB 机器学习 人工智能 决策树 sklearn
matlab初步回归代码TreeMap-eQTL变体的精细映射的结构化方法 TreeMap在cis-eQTL中优先考虑推定的因果变异,从而说明了一个位点的多位点效应和遗传连锁。 它采用3层嵌套设计来删除无信息的变体,并逐步减少信息性变体之间的冗余。 在外层,树引导的惩罚回归选择LD中的变体组或与转录变化相关的单个变体。 在中间层,逐步条件分析会迭代每个LD块内的变体组合,以识别特定于块的最佳解决方案。 在内部层,将从先前的层中选择的变量进行汇总,然后通过贝叶斯多变量分析以得出全局最优解。 TreeMap支持集群环境中的并行处理。 安装。 ## if you have not installed devtools, please do install.packages("devtools"); ## if on Mac Download "Command Line Tools for Xcode 12" from https://developer.apple.com/download/more/ before next step ## then install treemap devt
2022-04-28 15:52:02 1.13GB 系统开源
1
线性回归的因变量 Y 必须为连续变量,但当我们研究的因变量为分类变量时,因为不再是随机变量,不符合正态分布,因此不能采用线性回归,此时应该使用Logistic 回归。 Logistic 回归分析也用于研究变量之间的影响关系,即 X 对Y 的影响情况,此处涉及的Y 是分类数据。结合 Y 的具体情况,Logistic 回归分析可以分为三种,分别是二元 Logistic 回归、多元无序 Logistic 回归和多元有序 Logistic 回归。Logistic 回归分析的分类情况如下图:
2022-04-28 11:10:58 536KB SPSS
1
文本分类,使用机器学习算法,如朴素贝叶斯、逻辑回归、支持向量机等
2022-04-27 11:05:47 204KB 算法 机器学习 分类 逻辑回归
采用灰狼算法(GWO)优化BP回归预测matlab2019,内置数据集可以直接运行,全中文注释
2022-04-27 09:15:38 20KB 算法 回归 文档资料 数据挖掘
通过BP、GRNN、ELM、SSA-ELM对样本数据进行回归预测,SSA-ELM优于ELM>GRNN>BP(对自己的数据进行预测只需将样本数据进行替换即可)
1
Matlab集成的c代码级联高斯混合回归(C-GMR) Matlab源代码,用于训练和使用在以下方面提出的集成C-GMR(IC-GMR)模型和J-GMR模型: Hueber,T.,Girin,L.,Alameda-Pineda,X.,Bailly,G.(2015)“使用级联高斯混合回归的扬声器自适应声-发音反演”,在IEEE / ACM音频,语音和语言处理,第一卷23号12页,第2246-2259页 和 Girin,L,Hueber,T.,Alameda-Pineda,X。,(2017年),“扩展跨扬声器声学-发音映射的级联高斯混合回归框架”,在IEEE / ACM音频,语音和语言处理交易中,卷。 25号3,第662-673页 内容: cgmmTrain:IC-GMR模型的训练例程(给定训练集N个{输入(x),输出(y)}观测值和适应集N0 {输入(z)}观测值,通常N0 << N) cgmmMap:映射例程,用于使用IC-GMR(MSE准则)将输入(z)转换为输出(y)观测值 jgmmTrain:J-GMR模型的训练例程(给定训练集N个{输入(x),输出(y)}观测值和适应集N0 {
2022-04-25 11:18:23 21KB 系统开源
1